图形与计算那些事：AMD GCN架构历史解析--快科技--科技改变未来

正文内容 评论（0）

图形与计算那些事：AMD GCN架构历史解析

2012-01-06 11:06:08 编辑：上方文Q 评论(0)

HD4870的救赎：暴力扩充流处理器

HD2900XT的失败来自于很多方面，GPU核心架构只是冰山一角，就算保守的AMD沿用了DX9C时代的老架构，性能也不至于如此不济。但无奈GPU 架构已经定型，短期内是无法改变了，HD2000和HD3000一败涂地，AMD咬牙硬抗了两年之久。就在大家为R600的架构争论不休，大谈VLIW指令集的弊端有多么严重时，AMD终于迎来了翻身之作——RV770核心。

RV770核心：暴力扩充流处理器

RV770相比R600/RV670，核心部分依然没有任何变化，沿用了之前的Shader单元设计，只是将数量扩充了2.5倍，流处理器达到了800个之多！

图形与计算那些事：AMD GCN架构历史解析

RV670/R600是4组SIMD，每组16个Shader，每个Shader 5个流处理器；RV770是10组SIMD，每组16个Shader，每个Shader 5个流处理器。流处理器部分直接扩充了2.5倍！

虽然对流处理器部分没有改动，但AMD对流处理器以外的几乎所有模块都进行了改进，从而使得性能和效率有了质的提升，具体改动如下：

抗锯齿算法改变，性能大幅提升

纹理单元和光栅单元部分，和流处理器一样都是数量翻了2.5倍，但值得一提的是，抗锯齿算法已经由R600/RV670的流处理器部分转移至光栅单元部分，因此RV770的AA效率大幅提高，一举超越了N卡重现X1000时代的辉煌，这也就是RV770表现令人惊异的主要原因。

图形与计算那些事：AMD GCN架构历史解析

在纹理单元与显存控制器之间设有一级缓存，RV770核心相比RV670，L1 TC容量翻倍，再加上数量同比增加2.5倍，因此RV770的总L1容量达到了RV670/R600的五倍之多！

放弃环形显存总线，改用交叉总线

RV770还放弃了使用多年的环形显存总线，估计是因为高频率下数据存取命中率的问题，回归了交叉总线设计，有效提高了显存利用率，并节约了显存带宽。还有GDDR5显存的首次使用，瞬间将显存位宽翻倍，256Bit GDDR5的带宽达到了当时N卡512Bit GDDR3的水平。

总的来说，虽然流处理器部分没有做改动，但RV770的非核心架构部分有了很大的改良，上代产品许多设计失误得到了纠正，在流处理器数量暴增运算能力大大加强的情况下，消除了功能模块的瓶颈，从而使得性能有了大幅改进。

VLIW并未降低3D效率，只是妨碍了GPU计算

HD4870/HD4850打了一场漂亮的翻身仗，也让唱衰VLIW的人看傻了眼，之前大家普遍认为R600/RV670失败的主要原因是VLIW的低下效率，事实证明VLIW并没有错，其效率问题并没有严重到失控的地步，毕竟DX9C游戏还是主流，顶点与像素操作指令还是大头。AMD只是错误的判断了抗锯齿的算法和效率，导致第一代DX10 GPU性能不如预期。

但最关键的问题不在3D游戏性能方面，AMD对GPU并行计算依然没有投入足够多的重视，AMD一方面在鼓吹自家Stream通用计算并不输给CUDA，各种商业软件未来将会加入支持，另一方面GPU架构未做任何调整，API编程接口支持也举步维艰。结果就是Stream软件无论数量、质量、性能还是发布时间都要远远落后于CUDA软件。

责任编辑：