正文内容 评论(0)
2004年的IT市场中,昔日大搞频率之争的Intel与AMD好像都在闭关修炼,蓄好力量等待下一轮的战斗。一时间人们的眼球被nVIDIA和ATI深深吸引,不论在中低档次的图形处理芯片之争上,还是在高端产品的争夺上,两者你追我赶忙的不亦乐乎。nVIDIA于前不久首先推出了前所未有性能翻番的GeForce 6800 Ultra, ATI当然也毫不示弱,随即推出RADEON X800系列显卡,高端产品X800 XT PE当仁不让成为ATi新一代的旗舰产品,在两个月之前在3DMark03突破10000分是那么的不可思议,需要零下几十度的极端超频,匪夷所思。但是现在我们在测试中看到,新一代的旗舰轻松突破10000分大关,这昭示着一个新的显卡时代的帷幕正在揭开。

在规格上ATI的Radeon X800XT采用256bit GDDR3显存,核心和显存频率为520/1120MHz。这种近似恐怖的规格让我们一时也捉摸不到这些产品究竟有多么可怕的性能?而我们能看到的关于这款显卡的理论介绍也可谓铺天盖地,一时间玩家陷入参数的迷宫之中。

性能翻番到底是一个什么样的感念,在我们的心里面似乎没有什么东西可以当作参照物,只是凭空的想象而已。仅从产品设计理论上来对产品的实际性能进行评价显然是不全面的,我们更需要的是显卡在实际应用中的体现。
不过之前还是让我们先和X800XT PE来个亲密接触。
[近观X800XT白金版]
我们先来看看我们今天的主角ATi X800XT白金版。

[algin=center]ATI的Radeon X800XT
ATI的Radeon X800XT相对于不久前发布的GeForce 6800 Ultra来说,多少显得单薄了一点,薄薄的散热器不需要占用其他PCI槽的位置。习惯了Radeon 9800XT的小编自己也感觉到Radeon X800XT怎么这么轻。同Radeon 9800XT相比,散热器明显小了一大圈,裸露出显存芯片。和以前的DDR显存芯片相比,DDR3芯片工作时热量小很多,尽管工作在1120MHz的频率下,仍然不需要借助辅助散热措施就可以正常工作。外接电源部分只有一个4pin的电源接口。这就是即时渲染“RubyDoubleCross”动画的那张显卡吗?那精美细腻的画面真的出自这张卡?猛看第一眼还真不敢相信。

镭X800XT PE的接口依旧采用标准的15针模拟显示接口+DVI+SVideo,比较使用了双DVI加视频接口的NV的GeForce6800,虽然保守,但是目前更加实用。

紫色的电源接口,不插电源的话系统是无法启动的。那个黄色的接口是什么?又是一个电源接口?呵呵,自然不是,据说这是ATi的X800系列的视频子卡用的接口,加上子卡,X800就可以拥有完善的视频压缩处理功能。

背面没有9800XT时代的巨大整体散热片,所有的显存和零件都露在外面,因此整个卡也轻了很多

这就是1.6ns的DDR3显存,频率是1120兆赫,三星制造
因为Radeon X800XT PE是最新的旗舰产品,所以下面的章节我们就先从硬件规格和技术方面着重介绍一下Radeon X800XT PE,以及X800系列的一些共性。
[X800系列的硬件改进]
ATi研发X800的初衷就是获得更加优秀的性能,为此对于R3xx时代的架构进行了大刀阔斧的改进。那么具体的改进都在何处呢?下面看我们一一道来。
首先是硬件本身的改进,主要有如下三点:
一: 晶体管数目增加
从Radeon 9800XT进化到X800XT的新核心,R420芯片内部的晶体管数目比前者提高了45%,从R360时期的1亿1000万个增加到了如今的1亿6000万个。虽然这个数目还逊色于GeForce6800Ultra的晶体管数,但是也已经比奔腾4处理器还要复杂了。那么这些大幅度增加的晶体管具体都用在了什么地方呢?自然是X800系列大幅度增加的管线上。
二 管线大幅度增加
当R420的规格刚刚泄漏的时候,我们得知其渲染管线为12条,但是当GeForce6800Ultra以惊人的16管线面世的以后,我们最终得到的X800XT的渲染管线也悄然增加到了同样的16条。还有,对DX9游戏非常重要的处理顶点数据的Vertex管线数量增加到了6条,R360只有4条。稍微精简的版本X800RPO的渲染管线则是12条,这点ATi和NV倒是十分默契。

这就是X800系列的芯片结构图,我们可以清楚地看到各种管线的数目。
我们平时获得的三维图形处理就是按照先进行几何运算,再进行像素处理运算的流程在这个核心中完成的。而这个复杂的运算到生成的过程都是有核心内的Setup Engine实现的。而图像输出的后期处理则是由最下面的被称为“SmoothVision HD”的引擎完成的。后面我们将给大家仔细说一下这个新的图形引擎的特色,这里暂且打住,接着讨论硬件本身的改进。
三 迈向极限的频率
无论是核心频率还是显存频率,ATi的X800系列都创下了历史新高。稍微低端的X800 Pro的频率设定为475/900MHz,而给我们送测的旗舰X800 XT PE(白金版)则达到了前所未有的520/1120MHz。这些数值不但比过去的R9800XT提高了不少,而且比较NVIDIA的GeForce 6800系列也高了不少。因此呢我们可以说X800拥有更高的工作频率,而Geforce6800拥有更具有前瞻性的架构。
说到R800XT PE的520MHz的核心频率,这也是ATi第一次采用了0.13微米工艺的低介电质铜制程打造如此高频率的显卡。记得当年GeForce5800Ultra冲击500兆赫频率的时候,就碰得土头土脑,只能依靠巨大的散热器来保证系统的稳定,但是又被扣上了“吸尘器”的帽子。如今X800XT PE的频率已经超过了被5800U保持了很久的显卡核心主频的记录,而其单薄的散热器让我们非常担心。


看前面只有一个小小的风扇,而背后竟然连9800XT时代就有的散热片都不见了,相比全身披甲的Geforce6800U,这样的散热系统能让X800XT度过中国的炎炎夏日么?不过关于这一点,会在我们的实际测试中获得验证。
[解析X800系列的新技术上]
一般来说当一个新硬件发布的时候除了硬件规格的改善外,在软件技术上,也有相应的创新。那么这次X800又带来了什么新技术呢?主要就是以下几种,我们分别道来:
SmartShader HD
我们首先来谈谈X800系列所拥有的最新的SmartShader HD技术。SmartShader技术是ATi从第一代支持Shader的显卡Radeon8500开始就一贯拥有的着色器优化技术。历经8500-9700-9800-X800,这已经是第四代的产品了。
既然叫作Smartshader HD那么其技术自然就是为顶点着色器和像素着色器所服务的。新的Smartshader相比过去的版本有哪些改进呢?
首先我们来看顶点着色器,就是VertexShader,VS在目前的DX9.0b中的版本是2.0,也是X800系列支持的最高版本。使用了SmartShader HD技术的X800的VS单元比R9800有更高的顶点着色效率。加上我们前面讲过,因为X800将顶点着色器的管线数目也增加到了六个,因此在处理新的需要大量几何运算的画面中,例如波涛起伏的绿色海洋,绵延多变的山脉地表等等,X800系列的顶点着色器就会卓显其高效的优势。
我们再回过头去看SmartShader另一个重要的组成,就是像素着色器PixelShader,PS单元是为了处理各种复杂的三维图形最终输出的表面效果而辛勤工作的功臣。X800的像素着色器单元和镭9800一样,支持DirectX9规范中的24位精度要求(这里依旧不支持32位精度),加上大幅度增加的管线 ,其效能真的很让我们期待,据说像素运算操作的效能的峰值可以达到400亿次/秒。

昔日镭9800的着色器还受指令长度过短的制约,每个指令总长度最大仅仅只允许160条,这对于复杂的三维特效的实现来说是远远不够的,因此SmartShader也将这个 长度大大的提升到1536条。不过话说回来,这个长度虽然提高了很多,但是在最新的DX9.0c规格中这个指令长度已经达到无限了,ATi看来稍微落后了一点。
SMARTSHADER HD也提供了F-Buffer技术的改良,F-Buffer技术也是RADEON 9800系列率先引进的技术之一。F-Buffer 是「Fragment Stream FIFO Buffer」(分段串流式先入先出缓冲器)的简称,其处理复杂的特效时,只传递需要多次通过像素着色器引擎的像素,而其它的像素只进入渲染管线一次就完成了所有步骤。多通道像素储存在通道之间的F-buffer内,而非写入窗口缓冲器,使透明的像素可以分开储存前景颜色和背景颜色。这项技术不只节省了渲染时间、降低内存带宽需求,更能完美的掌握对象的透明度。
而且SMARTSHADER HD 将改良的内存管理功能加入了硬件之中,而不是将管理工作交给驱动程序的软件算法来做,这样解决了昔日很棘手的内存管理问题。
Hyper-Z HD技术
当显卡为我们在只是二维的显示器上绘制三维世界时,必须虚拟出来图形的纵深距离,这就在XY之外需要一个表示纵深的Z轴(Z-buffer)。
因此,对于三维运算来说Z轴的不断的更新计算是非常的消耗系统资源的,如果不想办法减少Z-buffer的所需的大量空间,那么大量的显示资源都会被消耗,而显卡速度也不可能突飞猛进。因此Hyper-Z HD技术就是ATi开发用在X800上的目前最高效的Z轴压缩算法之一。
Hyper-Z HD技术由以下几种技术共同组成:
Hierarchical Z :
这项技术是将Z-Buffer 区分为数个像素区块,以利快速检查这些区块是否能够在成像中出现。若整个区块会被隐藏,则直接舍弃此一区块而进行下一区块的着色工作。若区块的部份会显示出来,则再将此区块分割为更小的区块,重复检查的程序。
Early Z Test:
这项技术采用了成熟的算法,在个别像素进入着色引擎前先测试其可见度,可以有效消除过度绘图并使着色效率达到最高。
Z Compression :
这是一项用于压缩写入Z-Buffer 及解压缩读出Z-Buffer 的数据的无损失算法。HYPER Z HD 引进了改良型的算法,可以达到8:1 的压缩率,先期产品的压缩率是4:1。在任何状况之下,压缩率至少也能达到2:1。这项压缩技术在设计上是搭配反锯齿功能的最佳工具。在6x MSAA 之下,压缩率可以高达48:1。这项特性是RADEON X800系列反锯齿效能的重要指标。
Fast Z Clear:
这是一项可以在着色视框之间进行Z-buffer 快速清除工作的技术。此项程序在较高分辨率时尤为重要。例如,在1600x1200 分辨率之下,光是清除工作,每一视框就必须利用约7.7 MB的数据写入Z-buffer。HYPER Z HD技术只需要1/64的数据量就能清除Z-buffer,可大幅改善较高分辨率时的效能。
[解析X800系列的新技术 下]
SmoothVision HD
简单的来说SMOOTHVISION HD 技术就是RADEON X800 系列中所运用的最新的图像品质加强技术。可以通过不同的设定使其符合任何应用程序的需求。
SMOOTHVISION HD自动删除了渲染过程中生成的一些不真实的修饰效果,主力提升着色器生成的图像细节,通过改良的抗锯齿功能,新的各向异性过滤算法和后面要说的3Dc纹理压缩技术来在资源有限的情况下尽力的提高显示质量。
暂时性反锯齿
在RADEON X800系列的SMOOTHVISION HD特性中,优秀的全屏抗锯齿技术是其引以为傲的,而其中有一个新特性不得不提,就是暂时性反锯齿。

这项新技术会在每一视框中交替换用两种不同的预定义取样样式,持续性的显示会使两种取样样式的结果合并为一种结果。这样产生的影像,就因为人眼的视觉暂留效果,如同实际采样的两倍,可以提供相当高品质的抗锯齿图像,而且对显示性能造成影响甚微。它可以使2倍抗锯齿的效果接近以前的4倍抗锯齿。
面向未来的3Dc纹理压缩技术
ATI研发的3Dc 新式压缩技术第一次在RADEON X800系列图形芯片中采用。该项技术最大的特点就是让游戏软件业者能在实时3D 立体影像之中植入较以往更加细致的部分。
现今图形处理器主要采用数据与带宽压缩技术来完成与日俱增的性能与图像品质需求,对游戏本身而言,纹理数据通常是资源最大的消耗者。现今纹理压缩技术的标准的是名为DXTC (DirectX Texture Compression)的算法。DXTC在2D 色彩数组及以RGB与RGBA格式所贮存的数据压缩效果的表现上相当卓越,被多数的游戏开发公司所青睐。但是DXTC 在处理纹理压缩方面的能力远不如它在色彩数据压缩上的表现,3Dc 便是为了弥补DXTC 技术的种种不足而生的新技术,并提供快速而有效的新型纹理数据,3Dc 成为未来「高画质游戏」实现的关键性技术。
3Dc 可以为以往的纹理压缩算法所未解决的法线贴图压缩难题提供一个理想的解决方案。它提供了将近4:1的法线贴图压缩率,同时影像品质与未压缩前的图样几乎一致。此一技术系采用硬件加速,可以保证最小的画质损失。因此,开发人员可以不受限制的使用更高分辨率,甚至更加细致的法线贴图,同时可以将它们套用在所有布景当中的所有对象上,而不只是选择性的套用在单一对象上。

法线贴图可以轻易的让1000个多变形的效果媲美15000个多边形,节约大量的系统资源。因为3Dc技术的种种优异表现,已经被微软定为DX9.0c的标准技术规格,这可以说是ATi取得的一个技术上的优势。
[驱动安装以及X800XT和它的对手们]
我们收到的X800XT显卡的同时,还有ATI专门为之开发的软件包,其中包括专用的测试版显示驱动和3DMark03 DLL update补丁,其中驱动程序内还包含一些配套的多媒体软件。

我们在催化剂4.5的评测中说过其对X800XT并不支持,因此我们测试使用了ATi随光盘提供的显示驱动,该版本显示驱动为beta版,没有通过微软的WQHL认证,安装的时候Windows会出现以下窗口。并且这款驱动仅仅支持X800系列,不支持以前的产品,譬如Radeon 9800XT之类。这款驱动在功能上同催化剂4.5同样,如上图,界面没有之前国外网站透漏出的那么绚丽。

[X800XT和它的对手们]
为了更多的了解X800XTPE,我们更需要的是显卡在实际应用中的体现。因此我们请出早其一段时间发布的nVIDIA的新旗舰GeForce6800Ultra和它同场竞技,大家一起来看看。
今天摆在我们面前就是这两张显卡,我们要通过软件测试的方法来对这两张显卡的性能进行测试。这两张显卡在发布之初nVIDIA和ATI都表示是各自上一代产品200%的性能,我们这就要证明一下。再此之外,我们还要加入一张Radeon 9800XT来对测试结果作比较,感受一下巨幅性能提升的快感。


这是造型巨酷的GeForce 6800 Ultra,依然继承之前nVIDIA旗舰显卡的设计风格,硕大的散热器覆盖了整个显示核心以及显存颗粒,依然要占据两个PCI的位置。是否还记得GeForce FX5800时代人们称之为“电吹风机”,非同寻常的噪音给评测室的每一个编辑都留下深刻的印象。GeForce 6800 Ultra在散热方面做出了很大的改进,系统正常运行时的噪音大大降低。如此强劲的显示卡对电源提出了更高的要求,两个4Pin的电源接口证明了这一点,这是以前PC显卡所不具备的。


[测试平台]
虽然GeForce 6800 Ultra和Radeon X800拥有非常强大的图形处理能力,但是好马还需配好鞍,没有足够的系统资源的支持,恐怕也难发挥出最大的效能。就现在市场的主流配置来说,已经很难达到这两款产品的需求,因此在测试平台的搭建上我们尽量采用高配置。

采用Intel 875PE+CH5芯片组的磐正EP-4PCA3+是一款新能不错的主板,搭配上800MHz外频的P43.2C 处理器并且和四条DDR400规格的256M内存,并且打开超线程,最大程度的在测试中发挥这两款世界顶级显卡的性能。
测试使用的分辨率各为1024x768,1280x1024和1600x1200,使用一台带宽为230M的17寸CRT显示器来完成。在所有的图形处理测试项目中,每一个分辨率都要完成0xFSAA&0xAF,4xFSAA&0xAF,4xFSAA&16xAF三种环境下的测试,只有在高分辨率和高复杂的图形处理中,才可以真正体现出显卡性能的优劣,从而判断谁才是真正的王者。
下面章节比武正式开始!
[性能测试——基准性能测试]
3DMark2001SE
廉颇老矣,尚能饭否?3DMark2001SE作为DX8时代的领头羊是否能在DX9时代发挥余热?为了准确的得出高端显卡的DX8性能,同时也照顾一下使用中低端显卡(或者使用不支持DX9显卡)用户的实际情况,更加清楚自己的显卡和世界顶级的显卡在DX8性能上的差异有多大,因此3DMark2001SE也被列入到测试项目之中。

在1024x768分辨率下,关闭所有FSAA和AF的情况下,三张显卡得分比较相似,Radeon X800XT和9800XT甚至取得的几乎相同的成绩,看来DX8的测试项目显然不是这几位选手竞技的的舞台。

在1280X1024分辨率下,三位选手的差别才得以体现出来。从整体实力来看,Radeon X800果然名不虚传,在DX8的性能上超越了之前性能强劲的GeForce 6800 Ultra。

综合一下三款参测显卡在3DMark2001SE中各个分辨率下不同层次的测试结果,很容易看出,Radeon X800XT在DX8性能上比9800XT高出40%左右,同GeForce 6800 Ultra基本上处于同一个档次。看来“廉颇”真的老了,不能适应新时代的要求,实质性的性能对比只能在DX9或者高端的OpenGL游戏的性能对比中体现出来了。
3DMark03_340
上边我们也提到过,随X800XT显卡一起的光盘里包含了一个名为“3DMark03 DLL update”的补丁,在安装好3DMark03之后把这个补丁拷贝到C:\WINDOWS\system32\Futuremark\MSC下覆盖原文件即可。这个补丁加入了对X800系列显卡的支持,并且使其在3DMark03的运行当中有更好的公正性。

在3DMark03这个DX9环境的测试软件中三款显卡的性能优劣暴露无遗。首先X800XT较之9800XT有135%的性能提升,这不仅仅是两倍性能的提升的概念了。其实在这个测试项目中4xFSAA&16xAF子项的测试结果才能真正的说明X800XT和6800Ultra的差异,X800XT稍稍领先。

3DMark03中1280x1024分辨率下三款显卡的不同表现

高分辨率环境才是高端显卡竞技的角斗场,6800Ultra在没有2xFSAA&2xAF的包袱下遥遥领先,X800XT性能也比6800Ultra差。在4xFSAA&16xAF子项目中,X800XT的性能领先6800Ultra大约5%。
AquaMark3
同3DMark03相比,AquaMark3更加侧重显卡在实际应用中的体现,测试结果也受到广大用户的认可。在这个项目中同样采用三种不同分辨率中不同子项的测试。

在AquaMark3的测试中,我们发现X800XT与9800XT的差距没有在3DMark03中的那么明显,在1024x768的分辨率下X800XT稍稍逊于6800Ultra。

AquaMark3中1280x1024分辨率下三款显卡的不同表现,这个分辨率的通常状态下,6800U依旧有微弱的优势。

在1600x1200分辨率下才是这一代的旗舰们发挥发挥性能的战场,复杂的图形处理使打开抗锯齿后X800XTPE稍微领先了6800Ultra。而在1600x1200分辨率中开启4xFSAA&16xAF的情况下,甚至有28%大幅度的领先。
[性能测试——游戏性能]
FarCry(孤岛惊魂)自发布一年多以来,受到全球玩家的瞩目,绚丽的画面和精彩刺激的游戏场景让每一个玩家为之向往。由于其对计算机硬件要求之高而被称为“硬件杀手”,再加上这是一款完全基于DirectX 9的游戏,因此成为一款显卡性能测试的项目之一,并且得到普遍的认可。
首先简单的来一个测试说明:我们这次使用的是FarCry1.1版本,可以对系统硬件提供更好的兼容性支持,在测试中使用“VeryHigh”图形模式。
FarCry1.1中1024x768分辨率下三款显卡的不同表现

FarCry1.1中1280x1024分辨率下三款显卡的不同表现

FarCry1.1中1600x1200分辨率下三款显卡的不同表现

虽然是1024x768的分辨率,X800XT的表现当仁不让,大幅度领先6800Ultra。当分辨率增高时,6800U夺得了普通状态的冠军,而X800XT的优势则在打开抗锯齿和各向异性过滤后越加的明显,这个格局仿佛又回到了9800XT VS 5950Ultra的时代。
Call of Duty
仅只对显卡的DX9性能进行评测显然不够全面,更不够科学,毕竟OpenGL性能的测试同样占据着非常重要的地位,因为它造就了无数经典的游戏。Call of Duty(中文名:使命召唤)就是一款基于OpenGL游戏引擎的一款大作。我们采用回放事先录制好的demo来进行测试。
Call of Duty中1024x768分辨率下三款显卡的不同表现

Call of Duty中1280x1024分辨率下三款显卡的不同表现

Call of Duty中1600x1200分辨率下三款显卡的不同表现

X800XT不仅DX9性能出色,在OpenGL性能的表现上同样取得了相对以往长足的进步。在OpenGL性能方面,X800XT与9800XT相比依然达到了一倍性能的提升,与6800Ultra相比在打开了抗锯齿和各向异性过滤后,能以微弱的优势超出。
所有的测试X800XT PE的表现都说明了,其无愧是目前最快的显卡之一,而且在打开各向异性过滤状态下,其性能更是无敌的。
[辉煌的延续]
进行完所有的测试项目,第一感觉就是“这一代的两张旗舰显卡的性能都实在是太强了!” 。 综合了以上的测试图表中的测试成绩后,我们可以看出虽然ATi的Radeon X800XT和Geforce6800Ultra旗鼓相当,在各个不同的测试项目中,你来我往,打拼的不亦乐乎。
尽管和采用了大量拥有前瞻性的GeForce6800系列相比Radeon X800系列确像一款延续了R3xx辉煌的产品,但是其凭借超高的频率和首次加入的全新的诸如3Dc 新式纹理压缩技术等等的帮助,X800系列还是能够在众多的实用中和GeForce6800平分秋色。而且在实际应用中我们还发现,当打开了4倍全屏抗锯齿和16倍各向异性过滤的极端测试中Radeon X800XT表现就是天下无双了。我们虽然在测试时可以看出Radeon X800XT在各向异性过滤方面保持了较大的领先优势,但是关心硬件领域的朋友也知道ATi这个领先最近还在各个硬件论坛掀起了“优化”与“作弊”的激烈争论。而且两方各执一词,莫衷一是,至今还没有个令人信服的结果。
而且关于散热问题我们最后忍不住也要唠叨几句,X800单薄的身躯使其在测试结束时,温度极高。考虑到我们的测试的环境温度还没有达到一年之中最热的夏季,而且使用的是开放式的测试环境。首先,我们要承认X800的散热系统算是和安静的,但是这依旧让我们不得不担心在炎炎的夏季一个密闭的机箱中,X800XT PE真的散热系统真的可以坚持得住么?希望ATi在正式出货的时候,起码向镭9800XT一样在显卡背面也覆盖上散热片,毕竟520兆赫的核心频率和1120兆赫的显存所发出的热都是不容小窥的。

2003年的第四季度,nVIDIA 和ATI先后发布了GeForce FX5950Ultra 和Radeon 9800XT。作为当时世界顶级的PC显示卡,在DX9性能方面表现出来的性能让我们难以忘记。而半年之后的今天,这个纪录再度被刷新,而且是让前代产品黯然失色的翻倍提升,毫无疑问ATi 的Radeon X800XT已经成为ATi显卡发展史上的又一个里程碑。
现在阻碍镭X800XT普及的唯一的障碍就是价格了。X800XT白金版预计国内的上市价格在5000元以上,这可让不少朋友直呼囊中羞涩。不过我们又得到消息说,除了X800XT不仅仅只有 XT PE(白金版)这一款,而会有一个稍微降低一些频率的版本可能就叫做X800XT,而这款性能稍低,却定价在4000多显卡,可能会成为追求性能玩家的新宠。至于精简渲染管线到12条的X800PRO也已经在国内上市,价格不到4000元,也是一个很好的高端选择。不过X800PRO性能上,和X800XT系列就有一定的差距了。
我们觉得本质上X800系列的核心应该是一款性能达到极致的R3xx架构的延续,ATi用R3xx创造了辉煌的过去和现在,而使用了新核心R420的X800系列也将为其创造辉煌的未来。

