正文内容 评论(0)
面对DX11, AMD与NVIDIA背道而驰
从2006年NVDIA率先推出支持DX10规范的G80架构,到2009年AMD抢先推出宣告DX11时代来临的RV870,由DX9到DX10到DX10.1再到DX11,短短三年时间显卡就经历了四代的演变。不过,不管是AMD还是NVIDIA,之前的多数产品都是在上一代显卡架构基础上做出轻微改进,且对流处理器的排列组合进行调整,或改进工艺制程或规格翻倍,但整体架构的本质没有发生变化。这一切直到DX11世界来到人们面前的时候才有所不同。在微软正式推出DX11规范之时,AMD和NVIDIA选择了截然不同道路……
新瓶旧酒,AMD抢先发布HD 5000系列
去年9月23日,AMD抢先发布了支持DX11的HD 5800系列,显卡基于Cypress核心也就是我们通常所说的RV870。不过熟悉的读者可以发现,从R600到RV670到RV770再到RV870,AMD每一代的新产品只是在上一代显卡架构的基础上添加新的ShaderModel指令并扩充流处理器数量致使规格翻倍,而原有GPU核心图形架构的改动十分有限。不过为了夺得先机赢得市场,AMD推出的HD 5800系列还是沿用了RV770的核心架构设计思路,相当于将两个RV770核心封装在一起,并增加了一些新的指令以及部分改进,所以新一代的HD 5870规格是上一代HD 4870的两倍,而DX10性能方面也是HD 4870的两倍左右。
全新架构,NVIDIA卧薪尝胆谋划GF100
事实上NVIDIA之前的产品也是如此,从G80到G92的工艺升级,仅仅算做一次“马甲”战略, GT200也只是大核心下的规格大幅提升并强化了并行计算架构而已,核心架构相比G80改动甚微。但面对DX11的到来,NVDIA已经意识到旧的GPU架构已经不能满足新技术以及新游戏的需要了,GPU架构的全新改变,甚至重新设计势在必行。微软DX11/Windows 7的布日程显然并不止AMD一家知晓,NVDIA也很清楚这一点。按照正常道理,NVDIA在GT200架构的基础上加入对DX11的支持也应该不是太难,但与AMD的做法不同,NVIDIA并没有急于推出支持DX11的“新一代”显卡,这也是为何NVIDIA的DX11显卡晚到了半年之久。虽然如此做法的确会损失掉夺得市场先机的机会,不过NVIDIA非常清楚孰轻孰重,经过一番考虑之后NVDIA还是决定设计一个全新的架构,GF100应运而生。那么经过全新设计的GF100相比新瓶旧酒的RV870在面对DX11全新特性会有哪些优势呢?我们接着往下看。
[优势何在?GF100架构设计目标]承上文所述,面对DX11的到来NVIDIA与AMD选择了截然不同的道路,这其中的原因也是因为NVIDIA发现随着图形技术的不断发展,老一代GPU架构发展已经受到了制约。从早期的NV30到上一代的GT200,GPU的图形渲染能力提升了150倍之多,然而几何性能的却连3倍还不到,如果继续沿用老架构的设计思路必然会出现性能瓶颈。在DX10时代之前,游戏中的几何图形处理大都由处理器来承担,而DX11规范到来之后,对GPU的几何处理性能有了更高的要求,尤其是关键的Tesselation(曲面细分)部分,在后面的文章中也会着重介绍。鉴于此,NVIDIA将原有架构进行重新设计,并着重针对DX11特效中的Tesselation部分优化。下面就来剖析一下GF100的内部架构,了解其精髓所在。
在NVIDIA着手GF100全新架构之时,就已经构思了四个设计目标,确保为玩家打造一款拥有顶级性能的GPU。具体如下:
出类拔萃的游戏性能
虽然在专业图形和计算领域频频发力,不过PC游戏NVIDIA始终非常重视,提供顶级的游戏性能尤其是出色的DX11性能自然是GF100全新架构的首要使命,为此GF100做出的努力包括第三代流式多处理器(SM)、CUDA核心(流处理器)和ROP单元树立翻倍、几何学流水线大幅改进等等方面。
一流的图像质量
无论何时画质始终是游戏玩家非常热衷的话题,GF100首次加入了全新的32x CSAA覆盖采样抗锯齿。无论是多边形边缘还是透明纹理,GF100都能获得最高质量的抗锯齿效果,同时性能损失会降至最低。
电影般的几何学逼真度
上面也提到了随着图形技术的发展老的GPU架构已经受到了制约,尤其是GPU的几何学处理能力,这也就成为GF100得到改革重点之一,全新设计的GF100的几何学并行执行性能将达到GT200的八倍之多。
此外,GF100还加入了CG电影中的曲面细分和置换贴图两大技术,前者可以将较大的三角形细化为更小更多的三角形几何,后者则能改变这些三角形的相对位置,两种技术结合就能通过相对简单的描绘来完成复杂多变的几何模型。而GF100的整个渲染流水线都皆在为曲面细分和几何学吞吐量提供最大化性能,并为此特意设计了PolyMorph引擎和Raster引擎。
一款专为游戏量身打造的革命性计算架构
老一代GPU架构中的光栅化流水线已经看是显现疲态,实时管线追踪短期内又不显示,因此更为先进的新算法的推出迫在眉睫。GF100延续了G80中计算架构来处理游戏应用,在图形处理方面,诸多线程独立工作,而且线程之间还会相互通信、协调,对图形处理器与PhysX物理处理快速上下文切换、计算内核并执行、光纤追踪和人工智能算法增强等等都大有裨益。
[“四个核心”的GF100]在RV870核心当中,可以看到两组SIMD阵列呈对称型排列,其中每组阵列当中均有800个流处理单元设计,事实上在单一SIMD引擎当中,采用的排列方式依然是RV770的设计方式。从RV770到RV870,规格正好翻了一倍,可以看做由两个RV770核心封装在一起。虽然由GT200到GF100,流处理器也增加了一倍多,由240个增加到512个(完整的GF100核心,GTX480采用480个),虽然表面看来都是规格的增加,但事实上GF100的架构发生了很大的变化。
总体来看,GF100核心主要划分为Host Interface(主接口,主要负责PCI-E通讯传输,包括读取CPU指令等)、GigaThread Engine(主线程调度引擎)、四组Graphics Processing Clusters(GPC,图形处理集群,GPU的核心部分),其中每个GPC包含四组流式多处理器(SM)、四个PolyMorph引擎(多形体引擎,执行曲面细分的主要单元)、一个Raster引擎(也就是原有的光栅引擎经过重新设计并且位置也有所改变),而每组流式多处理器内又有32个流处理器(NVIDIA称之为CUDA核心,完整的核心拥有512个),六组Memory Controller(GDDR5显存控制器,每组显存控制器位宽为64bit,总位宽384bit)、L2 Cache(二级缓存,容量为768KB)、六组ROP单元(每组包含8个ROP,共48个)。
四组(16个)SM都是高度并行的多处理器,能在任何时候支持最多48个Wrap。512个CUDA核心都是统一的处理器核心,能够执行顶点、像素、几何学和计算内核等不同任务。48个ROP单元可用于像素混合、抗锯齿、原子存储等操作,每组6个由一个64位显存控制器进行控制。统一的二级缓存则能够提供载入、存储、纹理操作等服务。
所以GF100架构实际的运作流程就是在GPU通过主接口获取了CPU的指令之后,GigaThread引擎将会从系统当中调取GPU所需计算的数据,并且拷贝到存储器当中。随后,GigaThread引擎将这些数据为不同的SM创建和分派线程块。每组SM会将GigaThread引擎分配来的线程块分配至Warp(32个线程的群组,后文当中为大家详细介绍),再由Warp调度器重新分配为线程,并由分派单元派发至每个CUDA核心或者其他执行单元上。
如果此时某一个SM阵列当中的工作出现无法完成的情况,例如在完成了Tessellation(曲面细分)以及光栅化之后即将进入其他流程,但是单个SM阵列无法完成全部工作,那么GigaThread引擎能够将这些已完成的数据重新分配到其他的SM阵列当中,避免了因为某一个SM阵列数据量过大,导致所有SM阵列空循环,从而提高执行效率。
如果说RV870类似一个“双核心”的GPU,那么GF100就可以看做“四核心”设计了。相比GT200,GF100引入了GPC,并在在每组GPC以及SM阵列中加入了Rester引擎以及PolyMorph引擎,事实上这也是GF100相对老一代架构针对DX11作出的最大改变。
[专为Tesselation设计的GF100]我们知道,DX11带来的最大改变莫过于Tesselation(曲面细分)技术,其它几个技术在DX10规范下完全可以实现,只不过效率很低,所以直到DX11才得以加入。而全新设计的GF100专门为Tesselation引人了PolyMorph引擎(多形体引擎,执行曲面细分的主要单元),这一点的作用类似RV870中的图形引擎,只不过前者每个SM阵列中均有一组PolyMorph引擎,加在一起也就是16组,并且每四组PolyMorph引擎还拥有一组Raster引擎,而RV870中仅有一组图形引擎。所以在Tesselation性能方面,GF100相比RV870就更有优势。
PolyMorph引擎的工作流程可分为五个阶段:顶点拾取、曲面细分、视口转换、属性设置、流式输出。每个阶段中的运算结果都会被发送到一个SM,由其执行游戏的着色程序并将结果返回到引擎中的下一个阶段,而五个阶段全部完成后结果就会发送到Raster引擎。
基元在PolyMorph引擎中处理完毕后便发送至Raster引擎,这里又分为三个阶段:边缘设置、光栅器、Z轴压缩。事实上这些阶段在此前的GPU中也都存在,GF100只不过将它们放在了一起,而且全部四个Raster引擎采取了并行工作的方式,从而实现更高的三角形吞吐量。
正是通过GPC架构几何流水线的重大突破,GF100提供了曲面细分所需要的更高级别三角形和光栅化性能,几何性能也达到了GT200核心的八倍,并且随着曲面细分几何复杂度的增加,GF100会更加得心应手,超越竞争对手的幅度也会越来越大。
[DX11精华所在 Tesselation的介绍]Tessellation一词相信大家并不陌生,早在DX9C时代,微软XBOX360游戏主机中由ATI设计的Xeno显示芯片就支持;从DX10时代到DX10.1时代,ATI HD2000/3000/4000系列显卡全都整合了一个叫做Tessellator的模块,虽然当时没有任何游戏能够支持该技术,但ATI几个演示Demo展现了Tessellation技术的魅力。
事实上,在更早的DX8时代,ATI就已经和微软联手开发了TruForm(N-Patch)技术,也就是Tessellation的前身,并被纳入DX8.1的范畴。但由于该技术有一些不可控制的BUG,因此被DX9和DX10无情的抛弃了。
Tessellation之所以未成气候,就是因为此前的技术还不够完善,另外GPU处理能力不足也是一大因素,因此ATI即便有微软的鼎力相助,也未能将该技术发扬光大。到了DX10时代,ATI虽然在全线GPU当中整合了Tessellator模块,无奈孤掌难鸣,并没有得到游戏开发商的支持。
直到DX11时代,GPU自身的性能有了长足的进步,硬件上真正具备了细分曲面的实力,再加上微软重新改写API渲染流程,专为Tessellation开辟了新的着色器,这才Tessellation技术得以重见天日。
Tessellation:细分曲面的原理
Tessellation这个英文单词直译为“镶嵌”,也就是在顶点与顶点之间自动嵌入新的顶点。Tessellation经常被意译为“细分曲面”,因为在自动插入大量新的顶点之后,模型的曲面会被分得非常细腻,看上去更加平滑致密。下面这张图形象的反映出Tessellation技术的原理和所实现的效果:
通过上面这张示意图,我们就可以更容易理解Tessellation技术是怎么回事了,它是一种能够在图形芯片内部自动创造顶点,使模型细化,从而获得更好画面效果的技术。Tessellation能自动创造出数百倍与原始模型的顶点,这些不是虚拟的顶点,而是实实在在的顶点,效果是等同于建模的时候直接设计出来的。
Tessellation技术是完全可编程的,它提供了多种插值顶点位置的方法来创造各种曲面:
1. N-Patch曲面,就是和当年TruForm技术一样,根据基础三角形顶点的法线决定曲面;
2. 贝塞尔曲面,根据贝塞尔曲线的公式计算顶点的位置;
3. B-Spline、NURBs、NUBs曲线(这三种曲线均为CAD领域常用曲线,在Maya中均有相应工具可以生成)
4. 通过递归算法接近Catmull-Clark极限曲面。
Tessellation技术最初主要被用以“细分曲面”,随着该技术被纳入DX11范畴,得到大范围推广之后,插值顶点的算法也越来越多,因此用途也越来越广,产生了很多非常有创意的应用。
Tessellation技术还经常与Displacement Maps(贴图置换)技术搭配使用,从而将平面纹理贴图改造成为具有立体感的几何图形,大大增强3D模型或场景的真实性。
除了大幅提升模型细节和画质外,Tessellation最吸引程序员的地方就是:他们无需手动设计上百万个三角形的复杂模型,只需简单勾绘一个轮廓,剩下的就可以交给Tessellation技术自动镶嵌,大大提高开发效率;而且简单的模型在GPU处理时也能大幅节约显存开销,同时大幅提升渲染速度!虽然ATI的HD2000以上级别显卡其实都具备Tessellation的功能,但它们却无法与DX11中的Tessellation技术相兼容。这是因为微软并没有原封未动的将R600的Tessellation技术抄到DX11之中,而是对其进行了优化,使之能与渲染流程完美的结合在一起,可以更高效率的细分出更多的多边形和曲面。与DX9C/DX10时代孤零零的Tessellator模块不同,在DX11当中,微软加入了两种全新着色器来全力配合Tessellator的工作,分别位于镶嵌器的前后。
其中Hull Shader(外壳着色器)用来控制自动生成顶点的数量和算法,也就是Tessellator的细分级别,然后交给Tesselator进行镶嵌处理,最后由Domain Shader(域着色器)按照程序要求生成所需曲面,并自动进行法线平移、置换贴图,产生新的模型。
与DX9/10中的Tessellation技术相比,DX11新增的两种着色器都受统一渲染架构支配,因此处理能力非常富裕,DX11版Tessellation不仅效率更高、而且细分级别更丰富。但是,更高的细分等级对Tessellator模块本身的处理能力提出了苛刻要求,这需要芯片厂商在设计之初就考虑周全。
下面,我们就通过2款较为明显的实际例子,来感受Tessellation技术的魅力,来说明游戏厂商和芯片厂商为什么如此重视这项技术。
随风飘扬的衣物和旗帜一直都是3D渲染的难题,此前想要达到逼真的布料效果,必须使用物理加速技术。虽然物理引擎可以达到和谐自然的动态效果,但衣物本身的细节还不够丰富,原因是游戏不可能将一块小小的布料做得太过复杂,这样会消耗太多的资源,得不偿失。而Tessellation技术之后,可以一定程度上代替物理引擎,不仅可以大幅加强布料本身的细节、实现动态逼真的效果,而且消耗资源很少。
在DX11代表作《科林麦克雷:尘埃2》中,就大量使用了Tessellation技术,虽然细分级别并不高,但其魅力已经显露无疑。

DX11模式下的旗帜,静态和动态效果都不错,当然细分级别感觉还不够
在线框模式下我们可以看到,原本由屈指可数的曲线勾勒出来的旗帜,已经被细分得密密麻麻,此时旗帜的运动细节变得更加丰富,在外力作用下可以产生更逼真的摆动效果。了解完Tesselation的诸多方面,下面自然是实际的测试,当然这里主要就是为了检验显卡的Tesselation性能。
[测试平台及说明]既然是顶级显卡,当然需要一套高端平台进行辅佐,处理器方面我们选择了Intel i7-920 2.67GHz,同时搭配Thermaltake U120E 散热器,主板为Intel原厂DX58SO。内存部分采用3条海盗船XMS3 DDR3 1333 1GB组建三通道,硬盘方面选择了西数WD6400AAKS 640GB。另外考虑到GTX 480的功耗,普通的电源已经不能满足需求,所以我们选择超频三青金石750豪华版这款电源,保证整套平台的供电充足以及稳定性。所有测试软件和Benchmark以及驱动均升级至测试截止的最新版本。
|
测试平台 |
|
|
中央处理器 |
Intel i7-920 2.67GHz |
|
主板 |
Intel DX58SO |
|
显卡 |
GeForce GTX 480|700/1401/3696MHz GeForce GTX 470|607/1215/3348MHz Radeon HD 5870|850/850/4800MHz Radeon HD 5850|725/725/4000MHz |
|
内存 |
海盗船XMS3 DDR3 1333 1GB X3 |
|
硬盘 |
西数WD6400AAKS 640GB |
|
电源 |
超频三青金石750豪华版 |
|
散热器 |
Thermaltake U120E |
|
操作系统 |
Microsoft Windows 7 32bit中文版 |
|
测试项目 |
微软DX11 SDK:SUBD11 微软DX11 SDK:PN Triangles NVIDIA DX11 SDK:Island11 Demo NVIDIA DX11 SDK:Hari Demo 《Unigine Heaven 2.0》 《尘埃2》 《潜行者:普里皮亚季的呼唤》 《异性大战铁血战士》 《BattleForge》 《地铁2033》 |
|
测试驱动 |
Intel Chipset Device Software驱动9.1.1.1025 PV版 NVIDIA显卡驱动197.17 For Vista/Win7 AMD显卡催化剂10.3 For Vista/Win7 |
软硬件安装完成以后,正确的测试方法是:开机进入到桌面上以后,待系统准备就绪后,才开始运行测试(关闭UAC、屏幕保护程序、系统还原、自动更新等对测试得分有干扰的系统任务)。所有测试项目都运行三遍,在测试成绩稳定、可靠的情况下,我们以其中最好的一次成绩为准。
[微软DX11 SDK:SUBD11]在发布DX11之时,微软也同时推出了专门针对开发人员的DX11 SDK开发包,其中包括了很多DX11的应用方案和演示Demo,下面我们就来通过微软的技术Demo来展示一些DirectX11的技术特性,而展示的主要方面就是DX11最关键的技术Tessellation。由于目前支持DX11的游戏不是太多,而支持的游戏也仅部分采用了DX11特效,同时Tesselation的级别也不高,下面我们就首先采用DX11 SDK的一些Demo进行测试。
测试中采用默认模式,Tessellation级别为2时,可以看到GTX 480领先HD 5870幅度有限,而GTX 470也并未超过HD 5850多少。但级别升至最高的31级时,N卡的领先幅度就比较明显了,而A卡基本上处于跑不动的局面。
[微软DX11 SDK:PN Triangles]前一个Demo画面是是动态的,而PN Triangles是静态的要求会相对低一些,仅供程序员参考,测试方法与前一个类似。
从测试结果来看在轻度Tessellation负载下GTX480/470的优势就已经很明显,一旦加重Tessellation负载之后,A卡就性能损失更为惨重了。
[NVIDIA DX11 SDK:Island11 Demo]前面两个SDK都是基于AMD的HD5000显卡开发的,主要展示了Tessellation技术最基本的应用,通过截图大家可以看到画面比较简单,即便如此GTX480/470已经展现出了过人的实力。下面针对NVIDIA官方发布的Demo进行测试。这个Demo名为Island11,该Demo应用了Tessellation(曲面细分)、Displacement mapping(置换贴图/位移映射)等技术构建了海洋上的一片小岛。投射到游戏中,该Demo主要实现的是海洋、水面及自然地形环境等的渲染。在Demo中,超逼真的海水和地形设计是展示的主要方面,细致的地形和微微泛起波浪的水面构建了几乎真实的场景环境。水面经过曲面细分之后效果非常出色,自然也极其考验显卡的Tesselation性能。
这个技术Demo的性能要求较高,水面和地形的大量数据需要计算。HD5000系列Tessellation性能不足的软肋再次展现,完全无法胜任高等级细分级别的需要,GTX480表现最佳,而GTX470也能超越HD5870,HD5850的成绩垫底。
[NVIDIA DX11 SDK:HairDemo]Demo由NVIDIA开发,该Demo主要应用了Tessellation(曲面细分)技术构建了一个简单的人体头发模型。投射到游戏中,该Demo主要实现的是人物的头发,乃至衣物、飘扬的旗帜等的渲染。该Demo除了一个简单的人物上半身模型、贴图和光照外,主体展示的就是人物的头发,随风飘动的头发非常写实。Demo,并没有加入PhysX效果,所以A卡运行起来也没有问题。
从结果来看,这款Demo的渲染量明显减小,不过这里N还是要明显好于A卡。GTX480大幅超越HD5870,而GTX470不仅胜过HD 5850不少同时也超过HD 5870
[DX11 Benchmark:Unigine Heaven 2.0]游戏引擎开发商Unigine推出的DirectX 11 GPU测试程序Heaven Benchmark自去年10月推出以来,就凭借对曲面细分等新特性应用的深度和广度成为媒体和玩家测试DX11显卡的重要工具,无论AMD还是NVIDIA都对其成绩相当看重。现在Unigine又宣布推出Heaven Benchmark 2.0版,对测试程序进行了升级改进,增加了更多的DX11特效以及对原有引擎进行优化。
测试方法:游戏内建Benchmark。
测试选项:分辨率为分辨率为1680x1050和1920x1200,分为No AA AF、4AA 16AF两种选项,开启Tessellation选项。
全新升级的Heaven Benchmark 2.0加入了更多DX11特效,尤其是曲面细分部分。在前面的介绍中我们也了解到GF100对曲面细分技术的良好支持,这一点在测试程序中得到了验证,GTX 480表现最好,GTX 470不仅成功打赢了HD 5850同时也超越了A卡单卡王者HD 5870。
[DX11游戏:《尘埃2》]
前面是从技术角度测试显卡的DX11性能,不过玩家最关心的还是实际游戏中的表现,下面的文章就选择几款比较有代表性的DX11游戏进行测试。《Dirt2》作为《Dirt》越野竞速系列的正统续作,今年一上市就受到了众多赛车游戏Fans的追捧,其受关注的程度丝毫不亚于早先发布的FPS大作《现代战争2》。不光如此,他还是目前使用DX11技术最多的游戏,基本涵盖了DX11中代表性技术,如硬件曲面细分、多线程、高清环境光遮蔽、以及计算着色器等。《DiRT 2》对DX11技术的全面支持也使得其成为DX11画质的最佳展示平台。
测试方法:游戏内建测试程序。
测试选项:分辨率为1680x1050和1920x1200,分为No AA、4AA以及8AA三个选项,所有画质均设置最高,DX11模式。具体测试结果如下:
作为面世较早的DX11游戏,《尘埃2》成为众多DX11显卡测试的对象,不过现在这并再是A卡的专利。GTX 480/470的出现盖过了HD 5870/5850风头,GTX 470表现超越HD 5850靠近HD 5870。
[DX11游戏:《普里皮亚季的召唤》]随着新世代显卡的发布,游戏的画质终点将逐渐转向DX11,《潜行者》最新的资料片《Call of Pripyate》就是其中的代表。《潜行者》系列游戏对最新的3D技术支持一向很迅速,第一部资料片《切尔诺贝利的阴影》是最早支持DX10特效的游戏之一,之后的资料片《晴空》又率先垂范DX10.1,而最新的《普里皮亚季的召唤》迅速靠拢DX11规范。《普里皮亚季的召唤》游戏采用基于X-Ray 1.6引擎,支持DX11/10.1/10中的大量画质增强技术,比如硬件细分曲面(Hardware Tessellation)、接触硬化阴影(Contact Hardened Shadows)、高清环境光遮蔽(HDAO)、后期处理(Post Processing)、陡峭视差贴图(Steep Parallax Mapping)、湿滑表面、动态延迟光照(阳光散射/泛光/调和映射)、日夜循环等等。
测试方法:游戏内建测试程序。
测试选项:1680x1050和1920x1200分辨率,所有画质最高,DX11模式,Rain场景,开启Tessellation选项。
这里与前面不同的是,不管是N卡还是A卡在开启4AA后都出现了较大的性能下降幅度,不过这并没有影响各款显卡的排名的先后顺序。GTX 480依然领先 HD 5870,GTX 470同样打败HD 5850。
[DX11游戏:《异形大战铁血战士》]由Rebellion开发、世嘉发行的科幻射击游戏《异形大战铁血战士》是世界上已经发售的支持DX11的第3款PC单机游戏,前2款分别为《科林麦克雷的拉力赛尘埃2》和《潜行者:普里皮亚季的召唤》。《异形大战铁血战士》也是根据电影改编的游戏。与其它粗制滥造骗钱的同名电影改编游戏不同,《本作不仅在剧情和游戏可玩性方面下足了功夫,而且在游戏画面方面将取得突破,AVP将会完全采用DX11引擎设计,大量使用最新的技术和特效,力图营造出接近电影品质的电脑游戏。
测试方法:由于游戏内没有内建测试程序,我们只能在游戏中选择一个固定的场景,利用Fraps记录帧数,反复测试取平均值。
测试选项:分辨率为1680x1050和1920x1200,所有画质均调至最高,同时关闭垂直同步选项。遗憾的是这款游戏并没有提供抗锯齿选项,不过可以开启AF,另外DX11模式下开启Tessellation。
1680x1050分辨率下两款A 卡的成绩有所回升,HD 5870竟然超过了GTX 480,虽然领先不多。而提升分辨率至1920x1200后A卡再次悲剧,GTX 480/470依然笑到最后。
[DX11游戏:《BattleForge》]《BattleForge》本身是一款DX10.1游戏,在HD5870发布当天停机维护一小时后正式加入了DX11模式。虽然这款RTS网游并没有在国内开服运营,国内玩家对其知之甚少,但能够如此神速的对DX11提供支持,而且新增的DX11模式对游戏性能影响非常显著,可以说是检验DX11显卡实力的必测游戏。
测试设置:1680x1050和1920x1200分辨率,所有画质最高,分为4AA 16AF、8AA 16AF三个选项。
测试方法:游戏自带Benchmark。
这款游戏针对A卡优化,所以测试成绩原本应该与其更有利。不过GTX 480/470还是凭借强大的性能压倒对手,不仅GTX 480胜过HD 5870,就连GTX 470也超过后者。另外在测试过程中,N卡一致比较流畅,而遇到复杂的场景,A卡就会时不时出现卡顿。
[DX11游戏:《地铁2033》]《地铁2033》(Metro 2033)是俄罗斯工作室4A Games开发的一款新作,也是DX11游戏的新成员。该游戏的核心引擎是号称自主全新研发的4A Engine,支持当今几乎所有画质技术,比如高分辨率纹理、GPU PhysX物理加速、硬件曲面细分、形态学抗锯齿(MLAA)、并行计算景深、屏幕环境光遮蔽(SSAO)、次表面散射、视差贴图、物体动态模糊等等。
测试方法:测试使用“Cursed”关卡,利用Fraps记录帧数,多次测试取平均值。
测试选项:分辨率为1680x1050和1920x1200,所有画质调至最高,DX11模式,分为No AA AF和4AA 16AF两种选项。
新一代的DX11“显卡杀手”再次诞生,《地铁2033》作为一款重磅的DX11游戏着实让众多显卡有些抬不起头,即便是前面一直表现优异的GTX 480也仅能维持在50帧左右,1920x1200分辨率开启4AA 16AF后,HD 5850也跌破了30帧的最低要求。不过总体来看两款N卡还是要好于对手。
[实至名归:GTX 480/470无愧真DX11显卡]文中开头就已经提到,在面对新一代图形API DX11时,NVIDIA和AMD选择了截然不同的道路。为了夺得先机赢得市场,AMD沿用了RV770的核心设计思路,只不过将核心规格翻倍并加以改进,抢在Windows 7操作系统正式发布之前,就推出了加入DX11指令集的HD 5000系列。而NVIDIA在清楚地认识到采用老一代的GPU架构已经出现性能瓶颈的时候,毅然放弃了夺得市场的先机,将原有架构推翻并重新设计,打造出全新的GF100架构。
在此,我们不能指责孰谁对谁错,毕竟两家的市场策略与发展眼光不同。不过产品性能孰优孰劣,我们倒是可以评头论足一番。从上面各项测试数据我们也很容易看出,在面对轻负载Tesselation特效时,HD 5870/5850尚能与GTX 480/470抗衡,后者领先前者的幅度有限。不过面对高负载Tesselation特效HD 5800就凸现软肋了,而GTX 480/470依然能从容面对,这一切都与核心架构的不同有很大关系,这一点前面我们已经介绍,这里就不再一一赘述了。
从DX11正式发布到现在已有半年,不过真正采用DX11特效的游戏并不是太多,甚至屈指可数。不过我们可以肯定,在未来的时间里肯定会有越来越多的DX11游戏陆续面世,而对Tesselation的采用也会越来越多,到那时GTX 480/470优势才会真正体现出来。虽然HD 5000系列抢得先机,不过谁是真正的DX11显卡结果已经不言而喻。



















































