正文内容 评论(0)

AMD Bulldozer架构
Bulldozer模块的指令获取和解码,每个周期可处理4条指令,而计算指令与在寄存器操作的x86指令会被分成8个内部微操作指令(uOPs),整数运算管道中ALU和AGU则两两成对,正好吻合。
在浮点运算单元方面,则准备了两个整合的128bit SIMD单元,这将兼容英特尔的256bit AVX指令集,AVX将在这两个128bit SIMD单元中执行。
不过GPU缺乏的是X86扩展指令集,不过如果有高性能GPU的加入,未来X86扩展指令集可能要退休也不奇怪,Intel没准要悲催了。
当然,当GPU用于图形计算的时候,向量计算单元将会充当统一渲染架构阵列、控制器的角色,通过搭配特定的图形硬件,用于Tesselation、图形、纹理、扫面转换等工作。
我们来仔细计算一下新GPU的性能,如果假定是1GHz计算单元频率,并且可每周期处理64个64-bit FMAD计算,1个FMAD则可算成两个FP浮点操作,整个算下来,每个1GHz计算单元,理论上可以达到128 GFLOPs双精度浮点运算(如果是单精度则是64 x 32-bit计算),如果要达到HD6970显卡的性能,只需7组CU计算单元就能达到。
本文收录在
#快讯
- 热门文章
- 换一波
- 好物推荐
- 换一波
- 关注我们
-
微博:快科技官方
快科技官方微博 -
今日头条:快科技
带来硬件软件、手机数码最快资讯! -
抖音:kkjcn
科技快讯、手机开箱、产品体验、应用推荐...
