正文内容 评论(0

向计算进军:AMD真正全新架构深度揭密
2011-06-27 08:48:44  出处:快科技 作者:朝晖 编辑:朝晖     评论(0)点击可以复制本篇文章的标题和链接
新架构:舍弃VILW回归non-VLIW SIMD

AMD全新图形架构的革新之路最根本的问题是,以往的VILW对于图形来说非常合适,但是对于计算就略显弱势了。不过从种种迹象来看,GPU的通用计算是AMD未来的一个很重要的发展分支方向,Fusion融合从某一方面来讲并不仅仅是简单地在CPU die里面放置一个不错的GPU,而是充分发挥和利用GPU架构优势完成CPU所不擅长的并行计算任务,GPU的并行处理性能将被更加重复的利用,CPU和GPU将实现无缝协作运行。所以AMD传统GPU的“重图形轻计算”显然不能适合AMD未来的发展方向。

在AMD的全新图形架构里,VILW将会彻底被摒弃,取而代之的是non-VLIW SIMD。从根本上来讲,二者很是相似——都可以并行的处理大量指令,但是执行效率却有天壤之别——VLIW是指令集并行(instruction level parallelism),而non-VLIW SIMD是线程级并行(thread level parallelism)。抛开其它过多不必要的深入研究(限于篇幅以后换个时间再谈),二者架构最大的不同就是关于VILW在通用计算表现不济,而为什么non-VLIW SIMD要加强这方面的讨论。

说到底就是VILW的编译器没有预调度处理机制,在执行过程中不能动态调度,其最大弱点也就在于此。虽然VILW5在图形方面的表现已经相当出色,但计算方面依然不能尽如人意。成也编译器,败也编译器,用这句话来形容VILW最恰当不过。对编译器的过分依赖,也导致了对编译器过高的要求,除了调度问题还包括扩充对编译语言支持之后,即便是通过中间代码进行抽象,编译器也未必能很好的处理和执行。

另外,VLIW的复杂性在某些时候(比如需要对一段程序优化和手动调试的时候)尽显无疑,虽然通常情况下这对图形渲染并不构成问题,但通用计算就不一样了。VILW复杂的天性使得调试和反汇编的每一步都困难重重,而且很难预计性能表现,至于找出和优化相关重要部分的代码就更不用说了。

在讲演中,AMD提供了一段示例代码,展示了VILW和non-VLIW SIMD编译器之间的不同,虽然主要针对开发人员,但是从中不难看出后者的改进之处。

AMD Graphics Core Next全新图形架构深度揭秘
VILW:图形渲染没问题,计算方面就……

去掉VILW之后,AMD又回归了传统的矢量SIMD,但也并非如此简单。以往GPU架构的元素并不会直接原封不动地放到新架构里,既然上文我们已经说过了流处理器单元,下面再来说说它最亲密的代替者SIMD,不过此时的SIMD已经不是彼时的SIMD了。

需要注意的一点就是不要和以往GPU架构中的SIMD混淆(包含大量处理器的阵列),新架构中的SIMD是一个真正的16D 矢量单元(包含16个标量ALU),根据我们之前介绍的概念,全新的SIMD可以在在一个时钟周期可以同时执行16次标量运算。和目前的Cayman一样,AMD的wavefront依然包含64个线程,也就是说一个SIMD需要4个周期循环才能完成一个wavefront。当然,每个SIMD中还会包含一个64KB的寄存器。

AMD Graphics Core Next全新图形架构深度揭秘

另外,类似于以往的流处理器单元,SIMD同样可以进行不同的整数和浮点运算。不过遗憾的是AMD并没有其中的细节方面做任何透露,不过我们还是希望AMD在可能的条件下带来不一样的出色改变。不过有一样能够确认的是64位浮点预算性能大幅提提高,基本上能够达到32位浮点运算的1/2 。虽然这对桌面用户来说并不能造成什么深刻的影响,但是对AMD进入高精度计算是市场是大有裨益的。

责任编辑:

文章内容举报

  • 支持打赏
  • 支持0

  • 反对

  • 打赏

文章价值打分

当前文章打分0 分,共有0人打分
  • 分享好友:
  • |
本文收录在
#快讯

  • 热门文章
  • 换一波

  • 好物推荐
  • 换一波

  • 关注我们

  • 微博

    微博:快科技官方

    快科技官方微博
  • 今日头条

    今日头条:快科技

    带来硬件软件、手机数码最快资讯!
  • 抖音

    抖音:kkjcn

    科技快讯、手机开箱、产品体验、应用推荐...