正文内容 评论(0)
承上文所述,面对DX11的到来NVIDIA与AMD选择了截然不同的道路,这其中的原因也是因为NVIDIA发现随着图形技术的不断发展,老一代GPU架构发展已经受到了制约。从早期的NV30到上一代的GT200,GPU的图形渲染能力提升了150倍之多,然而几何性能的却连3倍还不到,如果继续沿用老架构的设计思路必然会出现性能瓶颈。在DX10时代之前,游戏中的几何图形处理大都由处理器来承担,而DX11规范到来之后,对GPU的几何处理性能有了更高的要求,尤其是关键的Tesselation(曲面细分)部分,在后面的文章中也会着重介绍。鉴于此,NVIDIA将原有架构进行重新设计,并着重针对DX11特效中的Tesselation部分优化。下面就来剖析一下GF100的内部架构,了解其精髓所在。
在NVIDIA着手GF100全新架构之时,就已经构思了四个设计目标,确保为玩家打造一款拥有顶级性能的GPU。具体如下:
出类拔萃的游戏性能
虽然在专业图形和计算领域频频发力,不过PC游戏NVIDIA始终非常重视,提供顶级的游戏性能尤其是出色的DX11性能自然是GF100全新架构的首要使命,为此GF100做出的努力包括第三代流式多处理器(SM)、CUDA核心(流处理器)和ROP单元树立翻倍、几何学流水线大幅改进等等方面。
一流的图像质量
无论何时画质始终是游戏玩家非常热衷的话题,GF100首次加入了全新的32x CSAA覆盖采样抗锯齿。无论是多边形边缘还是透明纹理,GF100都能获得最高质量的抗锯齿效果,同时性能损失会降至最低。
电影般的几何学逼真度
上面也提到了随着图形技术的发展老的GPU架构已经受到了制约,尤其是GPU的几何学处理能力,这也就成为GF100得到改革重点之一,全新设计的GF100的几何学并行执行性能将达到GT200的八倍之多。
此外,GF100还加入了CG电影中的曲面细分和置换贴图两大技术,前者可以将较大的三角形细化为更小更多的三角形几何,后者则能改变这些三角形的相对位置,两种技术结合就能通过相对简单的描绘来完成复杂多变的几何模型。而GF100的整个渲染流水线都皆在为曲面细分和几何学吞吐量提供最大化性能,并为此特意设计了PolyMorph引擎和Raster引擎。
一款专为游戏量身打造的革命性计算架构
老一代GPU架构中的光栅化流水线已经看是显现疲态,实时管线追踪短期内又不显示,因此更为先进的新算法的推出迫在眉睫。GF100延续了G80中计算架构来处理游戏应用,在图形处理方面,诸多线程独立工作,而且线程之间还会相互通信、协调,对图形处理器与PhysX物理处理快速上下文切换、计算内核并执行、光纤追踪和人工智能算法增强等等都大有裨益。




