GPU将变成CPU？AMD下一代GPU特性解析--快科技--科技改变未来

正文内容 评论（0）

GPU将变成CPU？AMD下一代GPU特性解析

2011-08-03 15:21:09 编辑：鲲鹏评论(0)

下图是Bulldozer的具体结构，可以看到一个Bulldozer有2个整数运算的内核，每个内核有4个整数运算通道。4个通道内，2个ALU和AGU为一组，而现在AMD的架构是3个ALU和AGU为一组，最大能实现3个x86整数运算命令。如果是4个ALU和AGU一组的话，那么一个整数运算内核要比现有CPU内核大，如果是2个ALU和AGU一组的话，大约是现有内核的2/3。

GPU将变成CPU？AMD下一代GPU特性解析
AMD Bulldozer架构

Bulldozer模块的指令获取和解码，每个周期可处理4条指令，而计算指令与在寄存器操作的x86指令会被分成8个内部微操作指令（uOPs），整数运算管道中ALU和AGU则两两成对，正好吻合。

在浮点运算单元方面，则准备了两个整合的128bit SIMD单元，这将兼容英特尔的256bit AVX指令集，AVX将在这两个128bit SIMD单元中执行。

不过GPU缺乏的是X86扩展指令集，不过如果有高性能GPU的加入，未来X86扩展指令集可能要退休也不奇怪，Intel没准要悲催了。

当然，当GPU用于图形计算的时候，向量计算单元将会充当统一渲染架构阵列、控制器的角色，通过搭配特定的图形硬件，用于Tesselation、图形、纹理、扫面转换等工作。

我们来仔细计算一下新GPU的性能，如果假定是1GHz计算单元频率，并且可每周期处理64个64-bit FMAD计算，1个FMAD则可算成两个FP浮点操作，整个算下来，每个1GHz计算单元，理论上可以达到128 GFLOPs双精度浮点运算（如果是单精度则是64 x 32-bit计算），如果要达到HD6970显卡的性能，只需7组CU计算单元就能达到。

责任编辑：