正文内容 评论(0

从GPU诞生说起:AMD统一渲染架构回顾及展望
2011-06-28 17:40:18  出处:快科技 作者:朝晖 编辑:朝晖     评论(0)点击可以复制本篇文章的标题和链接
变化有限规格翻倍:双核心的Cypress

在RV770成功翻身之后,AMD终于有了充足的精力和条件着手开发下一代GPU了。2009年9月23日AMD抢先发布了收款DX11图形GPU——Cypress(此时AMD已经不再用输在命名GPU架构),轰动一时。同样是受益于5D超标量架构出色的可扩展性和40nm新工艺,Cypress在规模方面又有了惊人的提升,其中流处理器数量达到了疯狂的1600个。

从GPU诞生说起:AMD统一渲染架构回顾及展望
Cypress核心架构图

从架构来看设计方面来看,Cypress就像是两颗RV770封装在一起,流处理器部分可以看做是“双核心”设计,各项规格也都是RV770的两倍,比如1600个流处理器、80个纹理单元和32和ROP光栅单元等等。那么为什么要采用这种双核心设计呢?AMD给出的解释是,当流处理器扩充至1600个这样的恐怖规模时,不仅芯片设计制造的难度非常高,而且相应的缓存和控制模块难以管理协调如此众多的流处理器,一分为二的做法效率将会更高。当然,Cypress也并非简单的双核版RV770。

从GPU诞生说起:AMD统一渲染架构回顾及展望
Cypress架构前端

这种非常像是CPU中的双核设计,两颗核心各自相对独立,独享L1、共享L2和内存控制器等其他总线模块,核心之间则通过专用的数据共享及请求总线通信。为了配合这两颗核心中众多流处理器的工作,装配引擎内部设计有双倍的Rasterizer(光栅器)和Hierarchial-Z(多级Z缓冲模块),这也是与RV770最大的不同。

在流处理器部分,RV870相对于RV770改进有限,只是加入了DX11新增的位操作类指令,并优化了Sum of Absolute Differences(SAD,误差绝对值求和)算法,指令执行速度提升12倍,此项指令可以在OpenCL底层执行。SAD算法应用最多的就是H.264/AVC编码的移动向量估算部分(约占整个AVC编码总时间的80%),如此一来使用RV870做视频编码类通用计算时,性能会大幅提升。

从GPU诞生说起:AMD统一渲染架构回顾及展望
Cypress流处理器单元

另外,流处理器部分还加入了双精度浮点运算支持,每个流处理器单元(包括5个流处理器)可以执行4条32-bit FP MAD运算,2条64-bit FP MUL or ADD运算,1条64-bit FP MAD运算,4条24-bit Int MUL or ADD运算,特殊功能区每周期可以执行一条32-bit FP MAD运算,均比RV770有了大幅提高。

Cypress的SIMD阵列的纹理单元也有多项改进,支持读取压缩后的AA颜色缓冲数据以减少带宽占用,此外纹理的差值运算转移到流处理器中而不再由纹理单元负责。Cypress的双线过滤纹理运算能力达到了每秒680亿次,实际性能中一大明显改变就是可实现各向无角度纹理过滤。

为了迎合DX11,Cypress还重拾了R600中的曲面细分单元,并加以优化和改进,使之可以更高效率的细分出更多的多边形和曲面。还增加了Eyefinity Display Contorllers,可以实现六屏输出,这也是Cypress的一个亮点。不过总得来说,Cypress相对RV770在架构方面改进有限,主要是新增了DX11新特性,另外利用40nm和新一代GDDR5显存在功耗控制方面做的非常完美,加上抢先发布性能均衡,受到了很好的市场反响,

责任编辑:

文章内容举报

  • 支持打赏
  • 支持0

  • 反对

  • 打赏

文章价值打分

当前文章打分0 分,共有0人打分
  • 分享好友:
  • |
本文收录在
#快讯

  • 热门文章
  • 换一波

  • 好物推荐
  • 换一波

  • 关注我们

  • 微博

    微博:快科技官方

    快科技官方微博
  • 今日头条

    今日头条:快科技

    带来硬件软件、手机数码最快资讯!
  • 抖音

    抖音:kkjcn

    科技快讯、手机开箱、产品体验、应用推荐...