正文内容 评论(0

没有想不到 趣味分析和预测GPU的发展
2012-01-11 17:05:47  出处:   编辑:朝晖     评论(0)点击可以复制本篇文章的标题和链接
数学模型还能做什么?

通过数据对比可以发现,3DMark Vantage性能和单精度浮点性能实际上能够很好地代表GPU微架构的性能。本文的两条回归曲线展示了GPU发展中大致应该达到的性能方向,如果要预测未来几年的GPU发展情况,在架构没有特别巨大改动的情况下,直接延伸曲线就能得到未来GPU的性能。不过众所周知的是,AMD下一代产品将改变架构,但NVIDIA的“开普勒”应该还会延续目前的Fermi架构,因此NVIDIA的斜率可以较为准确地预测未来“开普勒”架构下那些“正常”产品的性能结果(不包含过度阉割,如显存频率、位宽、GPU频率的产品)。而对于AMD下一代产品(GCN)来说,目前的斜率可能无法较为精确地预测性能。

当然,回归曲线的结果还可以得到另外一个结论,那就是目前市场上大部分GPU的周边配置——包括为每款GPU配置的显存位宽、驱动程序、频率等,都为GPU本身的性能作出了优化,否则很难有如此相当完整的曲线出现。而一些离曲线较远或者偏差较大的产品,无法准确推测出原因,因为笔者的模型较为简单,涉及的参数并不多。但是可以确定的是,这类距离曲线较远的产品要么性价比特别高,性能出色,要么就是由于显存位宽和频率等问题,导致性能不佳,不值得购买

同理,你还可以建立某类其他测试和单精度浮点性能之间的关系,唯一需要关注的是这些不同的负载或许将表示GPU在不同类型应用下的性能。3DMark Vantage和3DMark 11的侧重点就不一样,而一些专业的软件如SPECviewperf这样使用OpenGL的软件又会带来更多样化的结果(图4)。

没有想不到 趣味分析和预测GPU的发展
不同的基准软件会带来不同的预测趋势结果,玩家可以建立自己的预测模型并利用回归曲线来分析。比如使用较新的3DMark 11来考察有关DirectX 11的应用。(图4)

进一步扩展后,测试模型也可以用来比较不同微架构产品以及架构调整是如何影响GPU性能的。举例来说,对AMD的Cayman来说,随着大量测试数据的出现,可以建立一个不错的模型,用于和上代甚至下一代的GPU产品进行对比,从而从图形上明确展示出这些微架构的不同。NVIDIA方面,它的数据显得更为“整齐”一些,显示出NVIDIA在GPU方面良好的发展规划和架构潜力。

显存带宽和GPU性能的关系

下面,我们来看看显存带宽和GPU性能的关系。从图5和图6来看,虽然AMD显卡的数据点的分散度比较高,但相比之下,NVIDIA显卡的偏离更为奇怪一些。这意味着,单精度浮点性能往往并不意味着更高的性能。比如AMD的某两款产品,GPU本身单精度计算性能高达432GFLOP/s和422GFLOP/s,相当接近,但最终的3DMark Vantage成绩前者只有2552分,而后者却有3463分,性能提高了36%。这种情况在NVIDIA显卡上显得更为普遍,三款显卡都拥有理论192GFLOP/s的吞吐量,但性能分别是3700分、3374分和2527分,最大差距达到了46%。

没有想不到 趣味分析和预测GPU的发展

没有想不到 趣味分析和预测GPU的发展
这是AMD和NVIDIA显卡的3DMark Vantage GPU性能以及单精度浮点性能的散点图,已经画好了回归曲线,并且这两张图的坐标轴采用了等差数列,比较符合观察习惯。(图6)

实际上出现这样的原因还是因为GPU的架构造成的。以AMD Cayman为例,流处理器阵列只是GPU的一个基本架构,但其它的一些组件如纹理缓存、采样设计、ROP单元以及显存控制器等固定功能单元(也依赖驱动软件优化)也在显著影响着系统性能。在这些设备中,对GPU系统影响最大的还是显存控制器以及相应的显存颗粒。3D图形计算需要高速的显存速度来满足数据传输的需求,因此目前的高端GPU都使用了经过优化过的、专为图形系统设计的GDDR5颗粒来满足对带宽的需求,更便宜的GDDR3或者DDR3已经无法达到要求了。除此之外,ROP单元往往和显存控制器有关系,因此显存带宽的性能也会涉及到类似ROP这样的固定功能硬件。因此,在这种情况下,我们必须加入对显存带宽的考虑,需要进一步分析来得到一个初步结果。

表2是15款移动版GPU的详细信息,不过这并不影响分析结果。从表中可以看到,这些数据中涉及了DirectX版本、流处理器数量、频率、显存带宽、显存位宽、3DMark测试成绩等多个数据。笔者将拥有相近的理论单精度浮点性能的显卡分为一组,每组显卡的的最终成绩和显存带宽并不相同。其次,从数据可以看出,显存带宽对GPU的性能实际上起着比较重要的作用。比如AMD的Radeon HD 3870和Radeon HD 4670,前者的显存带宽达到了后者的2.12倍,而性能也是后者的136%。

没有想不到 趣味分析和预测GPU的发展
表2:15款显卡的详细信息

NVIDIA显卡的情况也比较类似,但显存对NVIDIA显卡的影响比AMD显卡更为显著。比如GeForce 9800M GTS、GeForce GTS 160M和GeForce GT 420M,这三款显卡的理论单精度浮点性能是一样的,都是192GFLOP/s,但由于显存带宽的差异,256bit显存位宽的两款显卡比128bit显卡的性能分别提高了33%和46%。另外一组对比结果也显示,200%的显存带宽能够带来45%的性能提高。这些都显示了GPU核心对显存带宽的渴求度依旧没有彻底满足,显存带宽仍然是GPU性能的瓶颈。不过在低端的GeForce GT 335M和GeForce GT 4200M上,显存带宽增加了接近300%的时候,性能才提升了40%,显然GeForce GT 335M虽然有很高的带宽,但并没有获得与此匹配的GPU性能。这说明,中高端显卡对显存速度的需求更高,相反,中低端产品并不需要特别高的显存速度,这是由GPU核心的性能所决定的。

从上述数据可以看出,显存带宽的增加或者减少能够解释之前性能模型中出现的一些问题。笔者的数据表也证明了显存带宽和GPU性能没有线性关系,性能比例的提升完全决定于GPU架构的性质、性能以及工作负载。对于非常需要显存负载的架构或者那些被显存带宽约束的GPU,提升显存带宽会得到相当明显的性能增幅,反之则并不会有特别明显的结果,甚至可能造成浪费资源。这在实际游戏中表现可能会更为明显一些,对程序设计人员来说,积极利用GPU的缓存也可以降低GPU对显存带宽的需求。根据笔者的分析和前面的一些统计数据,在大部分情况下,提升一倍显存带宽,大约可以带来30%的性能提升

简单公式,不简单结果

在本文中,笔者利用了一个非常简单的数学模型以及回归分析方法,为GPU建立了一个数学统计模型,并得到了利用单精度浮点性能来粗略估计GPU性能的方法。虽然模型简单甚至粗糙,但实际结果表现却还不错。最后,笔者还对另一个影响GPU性能的重要因素——显存带宽进行了单独讨论,也带来了一些比较有实际意义的结果。

实际上,本文的核心重点并非在于指导GPU的未来发展,甚至预测GPU的发展方向。它的意义在于,给出了一种数学方法,指导大家特别是普通玩家如何利用数学来有效构建模型,并建立自己的GPU研究数据库,难度不算高。

责任编辑:

  • 支持打赏
  • 支持0

  • 反对

  • 打赏

文章价值打分

当前文章打分0 分,共有0人打分
  • 分享好友:
  • |
本文收录在
#快讯

  • 热门文章
  • 换一波

  • 好物推荐
  • 换一波

  • 关注我们

  • 微博

    微博:快科技官方

    快科技官方微博
  • 今日头条

    今日头条:快科技

    带来硬件软件、手机数码最快资讯!
  • 抖音

    抖音:kkjcn

    科技快讯、手机开箱、产品体验、应用推荐...