正文内容 评论(0)
编者按:2002年上半年,在显示核心领域沉寂多时的矽统科技(SiS),依靠Xabre系列的成功上市正式宣告重返显卡市场。时隔半年之后,SiS再度发力推出了Xabre600显示核心,从而使Xabre系列在Xabre80、200、400的基础上得到了进一步的延续。那么这款产品到底有了什么新的变化呢?
从Xabre400开始,矽统科技就一直在推广它的一个“8X8”概念,也就是同时支持AGP 8X和DirectX 8.1技术。到Xabre600推出的时候,矽统已经将它的名称改为“Pro8X8”,表示Xabre600在这项技术上进行了升级,而这个升级主要就表现在了Vertexlizer技术的引入。
顶点着色引擎:
DirectX 8.1中引入了一个非常重要的变化,就是增加了可编程的顶点着色器(Vertex shader)和像素着色器(Pixel Shader)控制技术。这给图形软件设计师带来了更多的自由空间,使他们的作品可实时生成与以往静态CG设计相媲美的光影转换效果。然而,在硬件设计中实现顶点着色器和像素着色器会导致显示芯片核心尺寸大幅提升,从而使生产成本也明显提高。直到最近,这些功能也仅仅存在于高端的绘图芯片产品中。
可编程顶点着色器是建立在一套控制顶点数据的指令系统之上的,它包括许多复杂的数学运算,比如:dst、lit、log、exp、rcp和rsq。当顶点着色器接收到数据去执行某一指定操作时,顶点着色器将使用寄存器存放从顶点着色处理器中进出的数据,由此导致的结果是需要大量的寄存器。不过这也使得芯片的核心尺寸迅速膨胀,因此影响了产品的成本。
在一些早期的图形处理器中,并没有集成硬件顶点着色器,它们是通过由CPU模拟完成大量精确的数学运算来实现DirectX的,不幸的是,某些类型的数学运算并不适合由CPU来完成。另一方面,对比中央处理器(CPU)和图形处理器(GPU)进行硬件顶点着色计算的能力后,你就会发现,目前最强大的图形处理器在四条平行顶点管道同时工作的情况下,每秒可以处理1.2G条指令,然而一个带有SSE2技术的2.5GHz CPU每秒可以处理10G条指令。很明显,CPU的运算能力要远远超过市场上最先进的图形处理器。由此可见,单纯的软件或者单纯的硬件顶点着色器都不是最佳的、最有效率的解决方案。这意味着,在这个高速CPU相当普及的时代,特别优化的架构或许是一个最佳的选择,而且还能同时提供最佳的性价比。
Xabre的解决方案:最佳化硬件 Vertexlizer 引擎
顶点着色器的工作流程是这样的:首先,顶点数据由顶点缓冲器中读出,写入1号临时缓冲器。然后在原始数据的基础上进行剪辑处理,把原始数据从1号临时缓冲器读出,写入2号临时缓冲器。接着,GPU的驱动程序将把顶点数据转移到AGP或者本地帧缓冲中。最后,由GPU从AGP或者本地帧缓冲中读取顶点数据进行计算。由此可见,整个数据转移过程需要通过四次读取、三次写入才能完成。通常情况下,顶点数据非常庞大,因此数据移动过程中需要占用大量的内存带宽,显然这种数据移动方案的效率非常低。
为了提高执行效率并降低顶点着色器的硬件设计成本,Xabre系列处理器采用了名为“HW Optimized Vertexlizer(最佳化硬件顶点着色引擎)”的技术。最佳化硬件顶点引擎的架构如图2所示,之所以叫它“最佳化硬件”,是因为除部分由CPU执行起来效率更高的次要操作以外,GPU将负责处理绝大多数实时指令。驱动程序可以实时编译顶点着色器程序,并使用硬件加速装置,它支持Intel SSE/SSE2和AMD 3Dnow!加速指令,精度可达到完整的32-bit浮点。顶点着色器的性能表现和中央处理器的速度成正比,因此升级CPU将有益于最佳化硬件Vertexlizer的性能提升。另一方面,巧妙的顶点数据移动方案可以显著缩减对系统内存带宽的占用。最后还有一点值得注意,Vertexlizer引擎无需更换任何硬件就可以进行升级。
性能表现
下面让我们借用一下SiS的官方评测数据来说明Vertexlizer带来的性能提升。测试基于相同平台下,分别测试了Vertexlizer和软件模拟两种模式下,3DMark2001 SE的细化项目分数有何提升。
由数据可以看出,基准得分提升了7%,而Vertex Shader部分则提升了将近57%,最佳化硬件架构带来的好处显而易见。
采用最佳化硬件架构设计的Xabre显卡,其vertex shader性能与CPU速度成正比。按照SiS提供的数据,当你的平台基于Pentium4 1.8GHz时,你可以得到和MX440-8X相近的性能,而使用2.0GHz时,性能与Radeon 9000Pro相当,如果使用2.8GHz的Pentium4那么它也会增强到GeForce4 Ti4200的等级。基本上,CPU的频率每提高200-250MHz,Xabre600的顶点着色能力就增强10%。
(vertex shader性能与CPU速度成正比)
在测试中,采用Vertexlizer的Xabre600的倾斜角度较高,这意味着,在CPU提升幅度相同的情况下,Xabre将获得比其它GPU更多的性能增长。据此可以推断,当CPU速度超过3.0GHz以后,Xabre600的性能表现将好于大多数市场上的高级GPU。
总结:
Vertexlizer Engine是同时基于硬件和软件用于降低GPU工作负担并提高运行效率的技术。本质上说,Vertexlizer Engine整合在GPU的硬件部分约占30%,而另外的70%则是通过软件由系统CPU发挥出来。当CPU速度提升时,拥有最佳化硬件Vertexlizer架构的Xabre图形核心在性能上将领先其竞争对手,甚至在主流CPU速度下,Xabre仍然被证明在一些应用软件中拥有出色的顶点着色性能。此外,Xabre的最佳化硬件Vertexlizer架构可以在不更换任何硬件的情况下升级到未来的新版本,这将使其未来可以兼容2.0版本或者更高的vertex shader。
有人指出Xabre的Vertexlizer架构过分依赖处理器性能,并不是真正意义的硬件顶点渲染引擎,但是要知道这种解决方案不但提升了显示性能,更重要的作用在于可以减少GPU的晶体管数,电器复杂度和发热量,并且提供了更合理的价格。由此可见,Xabre600引入Vertexlizer架构的最大含义,应该在于保持产品现有成本竞争力的同时,尽可能的提升了显示核心的Vertex Shader性能表现,从而让Xabre系列得以保持在主流显卡中对DirectX8.1支持的领先地位。
本文收录在
#快讯
- 热门文章
- 换一波
- 好物推荐
- 换一波
- 关注我们
-
微博:快科技官方
快科技官方微博 -
今日头条:快科技
带来硬件软件、手机数码最快资讯! -
抖音:kkjcn
科技快讯、手机开箱、产品体验、应用推荐...