正文内容 评论(0)
GCN 2.0架构解析:全方位的增强
AMD自己从来没有用过GCN 1.0/1.1/2.0这样的表达方式,全部统称GCN,这里只是为了方便区别和描述而已。
R9 290X在架构上没有本质的变化,但在各个模块上都做了改进和增强,核心规模也大得多,使用了62亿个晶体管,不过在制造工艺保持28nm不变的情况下,核心面积依然控制得非常出色,438平方毫米只比“塔希提”大了24%。
架构总图:44个执行单元、2816个流处理器、四个几何处理器、64个ROP光栅单元、1MB二级缓存、512-bit GDDR5显存位宽、TrueAudio DSP、CrossFire XDMA引擎、六个Eyefinity显示控制器。
着色器引擎:R9 290X在大的层面上划分成了四个着色器引擎(Shader Engine),每个都包含11组计算单元(计算资源可灵活配置)、一个几何处理器(和其它着色器引擎负载均衡)、一个光栅模块(屏幕像素分区)、四个渲染后端(1-4个可配置)。
作为最基础的模块,计算单元在架构上丝毫不变,只是做了些许改进。
几何处理可以每个时钟周期处理最多4个原语,几何着色、硬件曲面性能也有所改进。
渲染后端最多16个,也就是64个ROP。二级缓存容量也扩充至1MB,依然可读可写,还能划分为最多16个分区。
显存位宽重归512-bit,即便等效频率降至5GHz,带宽也提升到了320GB/s。最关键的是,高位宽显存控制器需要大量核心面积已经成为历史,综合各方面改进这次反而要比之前的384-bit在面积上小了大约20%,因此单位面积带宽增加了50%。
异步计算引擎从两个猛增至八个,还有两个DMA引擎。
GCN 1.0/2.0效率对比:24%的额外面积带来了20-90%的性能提升。
DirectX 11.2:R200、HD7000系列都可以支持,但除了这个硬件管理GPU虚拟内存在之外真没什么很特别的。事实上,AMD提出Mantle就有刺激微软继续创新的意味。
全新交火技术:通过新的引擎,交火不再需要外部桥接器了,而是直接走PCI-E,GPU图形流水线也可以彼此直接访问,还支持帧平滑。
性能?双卡提升87%,三卡提升160%。如果泄露数据属实,新交火会很猛很猛。
GCN 2.0架构回顾:更快的性能、更高的效率、新的图形特性、新的计算特性。
延伸阅读——
“夏威夷”核心架构图、细节大曝光!
http://news.mydrivers.com/1/278/278514.htm
R9 290X/290官方幻灯片大泄露:交火真猛
http://news.mydrivers.com/1/278/278204.htm
R9 290X性能再曝光:双模式/交火威武
http://news.mydrivers.com/1/279/279383.htm