向计算进军：AMD真正全新架构深度揭密--快科技--科技改变未来

正文内容 评论（0）

向计算进军：AMD真正全新架构深度揭密

2011-06-27 08:48:44 出处：快科技作者：朝晖编辑：朝晖评论(0)

新架构：舍弃VILW回归non-VLIW SIMD

AMD全新图形架构的革新之路最根本的问题是，以往的VILW对于图形来说非常合适，但是对于计算就略显弱势了。不过从种种迹象来看，GPU的通用计算是AMD未来的一个很重要的发展分支方向，Fusion融合从某一方面来讲并不仅仅是简单地在CPU die里面放置一个不错的GPU，而是充分发挥和利用GPU架构优势完成CPU所不擅长的并行计算任务，GPU的并行处理性能将被更加重复的利用，CPU和GPU将实现无缝协作运行。所以AMD传统GPU的“重图形轻计算”显然不能适合AMD未来的发展方向。

在AMD的全新图形架构里，VILW将会彻底被摒弃，取而代之的是non-VLIW SIMD。从根本上来讲，二者很是相似——都可以并行的处理大量指令，但是执行效率却有天壤之别——VLIW是指令集并行（instruction level parallelism），而non-VLIW SIMD是线程级并行（thread level parallelism）。抛开其它过多不必要的深入研究（限于篇幅以后换个时间再谈），二者架构最大的不同就是关于VILW在通用计算表现不济，而为什么non-VLIW SIMD要加强这方面的讨论。

说到底就是VILW的编译器没有预调度处理机制，在执行过程中不能动态调度，其最大弱点也就在于此。虽然VILW5在图形方面的表现已经相当出色，但计算方面依然不能尽如人意。成也编译器，败也编译器，用这句话来形容VILW最恰当不过。对编译器的过分依赖，也导致了对编译器过高的要求，除了调度问题还包括扩充对编译语言支持之后，即便是通过中间代码进行抽象，编译器也未必能很好的处理和执行。

另外，VLIW的复杂性在某些时候（比如需要对一段程序优化和手动调试的时候）尽显无疑，虽然通常情况下这对图形渲染并不构成问题，但通用计算就不一样了。VILW复杂的天性使得调试和反汇编的每一步都困难重重，而且很难预计性能表现，至于找出和优化相关重要部分的代码就更不用说了。

在讲演中，AMD提供了一段示例代码，展示了VILW和non-VLIW SIMD编译器之间的不同，虽然主要针对开发人员，但是从中不难看出后者的改进之处。

VILW：图形渲染没问题，计算方面就……

去掉VILW之后，AMD又回归了传统的矢量SIMD，但也并非如此简单。以往GPU架构的元素并不会直接原封不动地放到新架构里，既然上文我们已经说过了流处理器单元，下面再来说说它最亲密的代替者SIMD，不过此时的SIMD已经不是彼时的SIMD了。

需要注意的一点就是不要和以往GPU架构中的SIMD混淆（包含大量处理器的阵列），新架构中的SIMD是一个真正的16D 矢量单元（包含16个标量ALU），根据我们之前介绍的概念，全新的SIMD可以在在一个时钟周期可以同时执行16次标量运算。和目前的Cayman一样，AMD的wavefront依然包含64个线程，也就是说一个SIMD需要4个周期循环才能完成一个wavefront。当然，每个SIMD中还会包含一个64KB的寄存器。

另外，类似于以往的流处理器单元，SIMD同样可以进行不同的整数和浮点运算。不过遗憾的是AMD并没有其中的细节方面做任何透露，不过我们还是希望AMD在可能的条件下带来不一样的出色改变。不过有一样能够确认的是64位浮点预算性能大幅提提高，基本上能够达到32位浮点运算的1/2 。虽然这对桌面用户来说并不能造成什么深刻的影响，但是对AMD进入高精度计算是市场是大有裨益的。

责任编辑：

文章内容举报