正文内容 评论(0

AMD向左NVIDIA向右?从Fermi架构看GPU发展
2009-12-30 10:33:51  出处:快科技 作者:紫竹 编辑:紫竹     评论(0)点击可以复制本篇文章的标题和链接
[4.R600接踵而至 AMD首代DX10架构出师不利]

NVIDIA推出G80架构时,AMD与ATI正忙于双A合并的事宜,AMD推出的第一代DX10架构的显卡依然是原先ATI负责的。在晚了NVIDIA将近半年之后,AMD于2007年5月份发布了基于R600架构的HD 2000系列显卡,由于AMD与NVIDIA在统一渲染器设计上的思路不同,R600的问世也让人们有机会对比A、N两家的不同。

AMD向左NVIDIA向右? 从Fermi架构看GPU发展
R600核心架构设计图

承前文所述,AMD的统一渲染器设计在原来的SIMD架构上改良而来,Superscalar超标量架构由1个4D矢量一个1D标量运算核心组成,进行传统的4D矢量运算时效率最高,而遇到1D标量运算时运算效率降至四分之一,所以需要更多数量的流处理器来弥补这个劣势。R600架构中设计了320个流处理器单元,分为四个SIMD阵列,每个阵列又可分为两组,每组40个sp单元。每阵列的80个sp中又分为16个小单元,每一组都是由5个流处理器和一个分支预测单元。

具体方式如下图所示:

AMD向左NVIDIA向右? 从Fermi架构看GPU发展
AMD显卡中每一个流处理器的详细结构

这张图也可以解释为什么AMD与NVIDIA显卡中流处理器数目差异如此之大,AMD所称的流处理器实际上是由5个小单元组成,所以通常称AMD显卡的中流处理器为流处理器单元,而NVIDIA显卡才成为流处理器,换算一下的话两者是5:1的关系。这个比列只是一种近似比较,实际性能还要考虑各自的频率以及效能。

AMD向左NVIDIA向右? 从Fermi架构看GPU发展
R600的纹理单元

R600内设计了四个纹理单元,正好对应SIMD阵列的数目。每组纹理单元拥有4个纹理过滤单元和8个纹理寻址单元,因此共有16个纹理过滤单元,32个纹理寻址单元。

AMD向左NVIDIA向右? 从Fermi架构看GPU发展
HD 2000系列首度支持Hardware Tessellation技术

在R600架构的显卡上还有两项技术值得一提,第一个则是Hardware Tessellation,也就是目前DX11中火热的硬件曲面细分技术,AMD在HD 2000显卡中引入了这一技术,不过当时的硬件环境远不成熟,Hardware Tessellation不具有实用性,只在HD 2000显卡上昙花一现,到了HD 3000系列就去掉了。

AMD向左NVIDIA向右? 从Fermi架构看GPU发展
AMD的环形总线技术

另外一个则是1024-bit环形总线技术,2900XT本身就拥有512bit显存位宽,已经是当时位宽最大的,G80最大位宽也不过384-bit。AMD在此基础上又引入了Ring bus环形总线,可以等效1024-bit位宽,如果使用高速的GDDR4显存,那么显存带宽可以轻易突破130GB/s(这一数值在今天的高端显卡上也不容易达到),普通的GDDR3显存带宽也有100GB/s以上的带宽。可惜的是当时的生产工艺还是80nm,512-bit的显存位宽要占据相当大的晶体管规模,AMD的环形总线技术也没有普及开来,到HD 3000系列上甚至精简为256-bit,但是搭配高速GDDR3显存来弥补。

R600作为AMD推出的第一代统一渲染架构在虽然亮点多多,但是在市场上并没有引起玩家的共鸣,性能上相对NVIDIA的G80并没有胜算,很快就被改进版的RV670架构所取代。

责任编辑:

文章内容举报

  • 支持打赏
  • 支持0

  • 反对

  • 打赏

文章价值打分

当前文章打分0 分,共有0人打分
  • 分享好友:
  • |
本文收录在
#快讯

  • 热门文章
  • 换一波

  • 好物推荐
  • 换一波

  • 关注我们

  • 微博

    微博:快科技官方

    快科技官方微博
  • 今日头条

    今日头条:快科技

    带来硬件软件、手机数码最快资讯!
  • 抖音

    抖音:kkjcn

    科技快讯、手机开箱、产品体验、应用推荐...