正文内容 评论(0)
[流处理器数量不决定性能]
从规格表中可以看出,HD 4650的RV630核心拥有高达320个流处理器单元,远远超过9600GSO的G92核心,仅从这一项数据上看9600GSO明显处于劣势。
NVIDIA虽然只拥有96个1D流处理器,但NVIDIA GPU采用的流处理器频率与核心频率异步的搭配方式,让流处理器频率可以达到核心频率的两倍以上,从规格表中可以看出,9600GSO虽然只有550MHz,但流处理器频率却高达1375MHz。
而AMD-ATI的GPU核心频率和流处理器频率始终保持着同步,HD 4650的600MHz核心频率虽略高于9600GSO,但是同样600MHz的流处理器频率却远远低于9600GSO。最终的峰值浮点运算速度比值为9600GSO:HD4650=264:384(GFLOPS)并等于96:320。
[执行效率决定一切]
既然HD 4650在终浮点运算上获胜,那为什么最终结果却是9600GSO以大幅度领先优势获胜能?另外一个重要原因就是NVIDIA的GPU具有更高的执行效率。
简单的来说,NVIDIA的GPU的每个流处理器都具有独立完整的ALU功能,而AMD-ATI的GPU是采用4D+1D的结构,每5个流处理器单元才能成为一组,才能行使完整的ALU功能。
NVIDIA的GPU在执行操作时每个流处理器都可以被充分利用起来。而AMD-ATI的GPU则要将操作指令转为同时支持5D ALU运算的VLIW指令,而且目前所有的5D组合都是固定,尚没有完善的技术来将流处理器单元拆开重组,如果在处理纯4D指令的时候,每个流处理器只能处理一条4D指令,将会由一个流处理器单元闲置,但却无法加入其他组合来共同工作,而对于NVIDIA则可以实现100%的利用率。
另外据相关资料显示,AMD-ATI的GPU中每组5个ALU中,只有一个能执行函数运算,浮点运算和Multipy运算,但不能进行ADD运算,其余的4个流处理器单元只能执行MADD运算。NVIDIA的GPU每个1D ALU是全功能的。
本文收录在
#快讯
- 热门文章
- 换一波
- 好物推荐
- 换一波
- 关注我们
-
微博:快科技官方
快科技官方微博 -
今日头条:快科技
带来硬件软件、手机数码最快资讯! -
抖音:kkjcn
科技快讯、手机开箱、产品体验、应用推荐...