正文内容 评论(0)
[前言]
NVIDIA和ATi谁的高端显卡性能最强,面对这个问题,恐怕没有谁能够给出可以说服众人的结论。而现在,NVIDIA和ATi的最强性能代表因为SLI和CrossFire技术的出现,又一次为显卡的性能疯狂提升做好的准备。
X1900系列作为ATi新的旗舰级产品,在性能上相比较之前的X1800XT可以说有了巨大的提升,当然X1900出现的主要原因还是因为X1800XT的实力不济,无法对NVIDIA的GeForce7800GTX构成威胁,而X1900则在性能上给GeForce7800GTX带来了极大的威胁。
本次我们评测室收到了两块来自蓝宝的X1900显卡,一块为X1900主卡、一块为X1900XT。
X1900的全新出炉能否为ATi带来根本上的改变吗?而X1900通过CrossFire技术所释放出来的性能到底有多强大呢?就这些疑问,我们驱动之家评测室将会给您带来答案。
[ATi X1900系列简介一:核心篇]
在之前驱动之家的评测文章中,我们评测室已经为大家介绍过了ATi X1900系列显卡。在这里我们再次为大家进行一下简单的介绍,更加详细的介绍请大家到[url=http://hardware.mydrivers.com/pages/200601242120_62497.htm]“48管线”的期待——X1900XTX详细测试[/url]中去了解。
跟R520一样,R580也使用了90nm制造工艺,48个像素着色处理器,8个顶点着色处理器,256-bit 8通道GDDR3显存,支持PCI Express x16,动态工作电压和工作频率控制,双DVI输出支持,但是,R580的晶体管数目达到了骇人听闻的3.84亿个,这些多出来的晶体管,大部分都被用到了新的像素渲染处理单元中去了。要满足这样一个“庞然大物”(其实体积并不算太大,但是能量消耗却实在是……),ATi要求最少450W的电源,要有30A的12V输出,如果是组成X1900 CrossFire则要求使用550W电源,12V要提供38A的输出能力才可以。看来现阶段玩家们所使用的电源在满足X1900 CrossFire上还不太容易做到。
R580和R520师出同门,都是X1000系列GPU,所以,它继承了R520的全部能力,包括Ultra-Threaded Shader Architecure(超线程渲染结构)、Shader Model 3.0、改良的显存控制器Ring Bus Memory Controller、用于屏蔽不可见渲染的Hyper-Z、HDR+AA(高动态渲染加上全屏抗锯齿,这是ATi引以为傲的技术)、128位的浮点指令渲染、自适应的抗锯齿、AVIVO、内建两个Dual Link DVI输出等等
48个像素渲染处理器。我们知道R520有16个像素渲染处理器,7800GTX有24个,而X1900一下子比X1800增加了两倍,达到了史无前例的48个,这是为什么呢?
ATi的研究工作表明,自从微软2001年在DX8中导入可编程的渲染引擎后,渲染处理在游戏中变得非常普遍,而渲染指令的复杂度也在以每年1.8倍的速度增长。渲染指令大致可以分为两类:纹理操作和算术处理操作,随着游戏的进步,算术处理操作的比重正在不断加大,最近的游戏研究表明算术操作:纹理操作=5:1,下一代游戏的比重还在加大。算术操作和纹理操作最大的不同在于,纹理操作依赖于显存容量和带宽等外部因素,当外部条件不足时增加纹理处理单元对性能没有帮助,而算术操作能力不取决于外部因素,是由GPU内集成的算术操作单元的能力和数量决定的。这两者之间相互还有关系,通过像素渲染程序可以生成纹理,通过渲染调整还可以减少纹理模板的数量,这两种办法都可以用来降低存储纹理所必需的显存和带宽。
在微软提出的SM3.0规范中,最重要的新特性就是像素渲染的动态分支控制。在早期的SM中所有的指令和纹理拾取都要在每个像素上面施加一次,不管他们是否需要,而流控制则可以根据实际情况在需要的像素上执行渲染。ATi的设计正确理解了流控制的愿意,认为动态流控制提倡的是让不同数据块执行不同的操作,为实现此目的,X1000系列引进了新的超线程技术,它通过一个庞大的联合线程计数器、小线程单元、专门的分支执行单元和一个巨大的、高性能的任务堆栈列表,在高速动态流控制和扩展并行处理之间取得最佳平衡。
[ATi X1900系列简介二:构架与技术篇]
[X1900的像素渲染架构]
X1000系列的GPU设计是把算术操作和纹理操作份分给不同的处理单元,算数操作交给像素处理器中的一组ALU完成,纹理则由专门的纹理单元完成,针对像素处理器,每一个时钟周期可以处理1——5条任意的渲染指令,专门的分支单元还拥有额外的多线程处理能力;至于纹理单元,每一个纹理单元可以在一个时钟周期内处理4个纹理拾取操作。所有这些单元都由超线程任务指派处理器来分配任务,这个任务分配器会经常重新派指令给各处理单元,让他们常常处于满负荷状态。
GPU要适应现在和未来游戏的关键点在于改进像素处理的速度,X1900在这一点最值得骄傲的是拥有48个像素处理器的巨大像素能力,算数能力达到了以前旗舰级产品的3倍,算数处理比纹理处理的比率为3:1,是兼顾目前与未来的完美比例。
[阴影渲染加速和Fetch4技术]
单阴影的实现过程很简单,就是先用光源投影来照射整个3D场景,得到的是一张被光源投影过的纹理样本图,每一个像素点用此样本图核实,如果有任何物体在此像素点和光源之间,那么此像素是阴影的,反之则是正常照射的。
要注意,这样创造出来的是一个轮廓极其鲜明的硬阴影,和自然界中的情况完全不符合,我们日常看到的阴影都是软边界的,具有复杂的过渡渐变,改进这个效果的一般方法是使用阴影过滤,实际上就是进行多次光源投射(编者:这个步骤,如果读者学过光学,就是模拟自然界中光的反射和衍射现象,实际上真实的阴影效果也就是这么来的,如果没有反射和衍射,我们在自然界中看到的也会是硬阴影),然后把多次投射样本效果混合到每个像素渲染处理中,样本数越多,效果就越真实,对GPU的处理能力负担越大。
动态分支机构可以只处理阴影边缘的样本混合工作,这样可以极大地提高阴影绘制的速度,X1900使用某种阴影样本过滤器来确定哪些点处于过渡边缘,这些点将被混合的样本渲染处理,而中心的点就可以用单样本纹理过滤渲染,这个方法在提高阴影效果的同时极大地减低了成像时间。
最大化这项技术就产生了fetch4,一个新的纹理样本过滤器,它由4个组成部分红、蓝、绿和透明度组成,具体细节颇为复杂,结果就是ATi认为这样可以用4倍于单一纹理过滤器的效率完美兼顾质量和速度,使得X1900可以用接近传统硬边阴影的速度生成高质量的软边阴影。
在X1900中,Hyper-Z的容量比X1800增大了50%。我们知道,Hyper-Z可以检测出最终成像时不会显示的像素,这样就可以在渲染前丢弃它们,Hyper-Z技术要求在芯片中提供一个高速缓存(编者:这是因为Hyper-Z是靠比较X—Y相同像素的Z值优先级,因此需要建立一个Z值索引)和一定的记忆体。使用大于2M甚至更多像素的高清晰显示正迅速普及,经常能看到1920*1200直到2560*1600分辨率的游戏设置,这时要描绘的分辨率所需记忆体容量一旦大于芯片能提供的记忆体容量,Hyper-Z就会开始降低渲染品质。通过集成更多的Hyper-Z记忆体,X1900可以保证在分辨率进一步提高的情况下不会引起画质急剧下降。
X1900如此强大的能力对于PC用户确实很新颖,但是早在ATi为微软的Xbox360设计的图形引擎上就已经使用了48个渲染处理器+16个纹理处理器。当然其中有一些不同(比如,Xbox360的渲染处理器没有像素和顶点的区别),但是这两个平台的体系一致性,使得游戏开发者不用花费特别的精力,就可以实现跨平台操作,这在以前的PC game和TV game泾渭分明的时代是无法做到的。
[测试平台及说明]
测试项目:3DMark03 Build360、3DMark05 Build120、3DMark06 Build102、Far Cry 1.33、DOOM3、Half Life 2、Quake4、CS-Source、Splinter Cell:Chaos Theory。
本次测试中,我们选择了Athlon FX55处理器,而缺少双核心处理器对于测试来说是个遗憾。在内存设定上,我们统一将内存时序设定为3.0-3-3-8。
蓝宝石X1900 Crossfire显卡的频率与蓝宝石Radeon X1900XT显卡的频率相同,同为625MHz/1.45GHz,拥有超大的512MB DDR3显存。
GeForce7800GTX 256MB显卡频率为标准的430MHz/1.2GHz。
X1800XT测试频率为625MHz/1.5Ghz。
在性能测试上,我们将分辨率定为1024*768与1600*1200,并进行打开4AA+8AF的测试。由于NVIDIA的GeForce7800显卡不支持HDR下的全屏抗据齿,所以在3DMark06测试中的特效测试中无法获得成绩。
[3D基准性能测试:3DMark03 Build360]
在3DMark03中,GeForce7800GTX 256MB全面压倒了X1900XT CrossFire和X1800XT CrossFire,但差距非常微弱,基本上都在几百分之内。我们看到,当分辨率提高到1600*1200 4AA+8AF下,三强的得分都没有低于11000,可见双卡在高分辨率特效下的性能优势。而X1900XT CrossFire的全面落后让人有点意外,刨除处理器性能无法满足X1900XT CrossFire的需要之外,还有一点可能是由于3DMark03过于陈旧,已经无法完全体现出当今硬件的性能,这样的情况也许会在3DMark05中得到改观。
[3D基准性能测试:3DMark05 Build120]
在3DMark05的测试中,X1900XT CrossFire开始发力,完全领先了GeForce7800GTX 256MB SLI,并且在1600*1200 4AA+8AF下得分依然保持在一万分之上。如果真的像笔者前面所说的那样,那么在后面的3DMark06中,ATi X1900XT CrossFire应该能够继续保持对GeForce7800GTX 256MB SLI的领先优势甚至是扩大其领先的比例。
[3D基准性能测试:3DMark06 Build102]
3DMark06的得分再次验证了我们之前的分析,且X1900XT CrossFire在1600*1200下的测试成绩对于GeForce7800GTX 256MB SLI来说有着不小的领先幅度。唯一遗憾的是由于GeForce7800显卡不支持HDR下的全屏抗据齿,所以在3DMark06测试中的特效测试中无法获得成绩。
[3D游戏性能测试:DOOM3]
由于NVIDIA在OpenGL方面的一贯优势,所以在DOOM3测试中GeForce7800GTX 256MB SLI全面领先也不足为奇,而ATi的X1900XT CrossFire配合其最新的催化剂6.2版,也已经将这个差距大幅度的缩小了。看来在对于OpenGL的支持方面,ATi已经前进了一大步。
[3D游戏性能测试:Quake4]
Quake4采用DOOM3的引擎,所以对于NVIDIA的显卡来说依然具有比较明显的优势。但令人欣喜的是,在1600*1200 4AA+8AF的测试中,X1900XT CrossFire凭借自身在高分辨率大纹理下强大的性能,居然硬是将GeForce7800GTX 256MB SLI压了下去。
[3D游戏性能测试:Half Life 2]
在Half Life2测试中,ATi的优势得到了体现,基本上都领先于GeForce7800GTX 256MB SLI。
[3D游戏性能测试:Far Cry 1.33]
在FarCry 1.33中,GeForce7800GTX 256MB SLI又全面处于领先,看来就算是在1600*1200 4AA+8AF这样的条件下,处理器的瓶颈问题依然没有得到改观。
[3D游戏性能测试:CS-Source]
CS-Source同Half Life2的关系就如同DOOM3与Quake4的关系一样,但在CS-Source测试中,GeForce7800GTX 256MB SLI的表现却节节攀升,最后居然在成绩上超越了X1900XT CrossFire。我们可以看出,随着全屏抗锯齿和各项异性过滤的打开,X1900XT CrossFire及X1800XT CrossFire的性能都在稳步的下降,而GeForce7800GTX 256MB SLI的性能却没有受到什么影响,这一点十分奇怪。就笔者个人认为,其驱动方面出现问题的可能性相对较大,究其原因,读者朋友可以继续往下看。
[3D游戏性能测试:Splinter Cell:Chaos Theory]
在“细胞分裂3之混沌法则”中,ATi与NVIDIA同样是各有胜负,但随着全屏抗锯齿和各项异性过滤的逐步打开,GeForce7800GTX 256MB SLI的性能下降却越来越小,甚至当打开8倍全屏抗锯齿和16倍各项异性过滤之后,其得分居然同打开4倍全屏抗锯齿和8倍各项异性过滤下的成绩完全相同,并且将驱动换为ForceWare 81.98之后问题依旧。
[极端测试:X1900XT CorssFire全面爆发一]
为了最大限度降低处理器的瓶颈并完全发挥X1900XT CrossFire的性能,我们特别对测试中的显卡进行了极限测试。但由于NVIDIA的GeForce7800GTX 256MB SLI最高只能在1600*1200分辨率下打开8倍全屏抗锯齿和16倍各项异性过滤,所以我们就将极限测试定在了1600*1200 8AA+16AF上,以求最大限度的了解X1900XT CrossFire的性能。
当打开8倍全屏抗锯齿和16倍各项异性过滤之后,ATi X1900XT CrossFire的强大动力被完全的释放了出来,在正常的测试项目中,全都以明显的优势领先,尤其是在DOOM3和Quaek4的OpenGL这个NVIDIA的传统优势项目上,ATi X1900XT CrossFire更是以无可争议的优势占据打了个漂亮的翻身仗。虽然同样有着512MB的超大显存,但X1800XT的成绩就要逊色许多了。看来以X1800XT的表现来说,X1900XT的变革与改进的确取得了相当大的成功。
[极端测试:X1900XT CorssFire全面爆发二]
在前面的测试中我们已经对GeForce7800GTX 256MB SLI在CS-Source和Splinter Cell:Chaos Theory这两款游戏中的不正常表现进行了一个预先说明,现在让我们来看看这两项“问题测试”的结果。
注:*GeForce7800GTX 256MB SLI成绩存在问题,仅供参考。
在CS-Source测试中,当我们在1600*1200的分辨率下将4AA+8AF提高到8AA+16AF之后,GeForce7800GTX 256MB SLI的性能下降依旧不是很合理。对此我们可以比较之前相同引擎下Half Life2的性能下降幅度。如果读者朋友们不能在CS-Source测试中明显看出的话,那么我们继续往下看。
在Splinter Cell:Chaos Theory中的测试是不是更加让人一目了然,相比之前我们在1600*1200 4AA+8AF下得出的成绩相比较的话,在特效开到8AA+16AF的情况下,测试的成绩不但没有任何下降,反而却从1600*1200 4AA+8AF下的103.3帧提升到了1600*1200 8AA+16AF下的103.6帧,这是在是有点让人费解,当我们把驱动程序从ForceWare 81.95更换为ForceWare 81.98后问题依旧。这样的问题在大多数情况下是出自驱动本身的,但也不排出其他原因。
当然,有兴趣的读者朋友们也可以发表自己的评论与大家进行讨论。
[总结]
ATi X1900系列的推出,一扫X1800系列性能不佳的表现,重新为自己树立的强者的形象。虽然本次测试中缺少了GeForce7800GTX 512MB SLI和X1900XT CrossFire的巅峰对决,但至少通过本次测试,让读者朋友们从客观的角度了解到了X1900显卡的强大性能。并且测试中采用的RD480也不能够充分发挥出X1900的性能。
现在评测室已经收到了ATi最新的RD580主板与X1900XTX CrossFire显卡,我们将在之后马上为读者朋友们奉献出更加精彩的内容,敬请期待。
本文收录在
#快讯
- 热门文章
- 换一波
- 好物推荐
- 换一波
- 关注我们
-
微博:快科技官方
快科技官方微博 -
今日头条:快科技
带来硬件软件、手机数码最快资讯! -
抖音:kkjcn
科技快讯、手机开箱、产品体验、应用推荐...