正文内容 评论(0

前端总线的弊病:多核心高性能计算表现不济
2008-04-30 10:45:39  出处:快科技 作者:上方文Q 编辑:上方文Q     评论(0)点击可以复制本篇文章的标题和链接

来自美国加州大学伯克利分校科学计算部门、劳伦斯伯克利国家实验室的研究人员们最近向IEEE递交了一份报告,在其中探讨了多核心超级计算机架构在格子Boltzmann模拟优化项目上的可扩展性。IEEE认为报告非常精彩,甚至可以颁个奖,不过Intel看到报告可能不会太高兴:至少在这次的考察中,Xeon和Itanium 2处理器表现非常一般,Cell BE则是最好的。

这次对比的处理器包括AMD Santa Rosa OpteronIntel Clovertown Xeon/Itanium 2Sun Niagara 2索尼-东芝-IBM(STI) Cell BE,均为多核心架构产物。研究人员们首先对模拟程序本身进行了深入优化,据称可比原来的LBMHD代码提速14倍之多。

前端总线的弊病:高性能计算表现不济
格子Boltzmann模拟

根据这份报告得出的结论,Cell BE的高性能计算表现最好,比如计算能力16.7GFlops、内存带宽16.7GB/s,多核心扩展性几乎是100%;接下来是Niagara 2和Opteron,借助HyperTransport总线技术,Opteron的扩展性也接近于线性(遗憾的是这里只测试了双核心Opteron,没有四核心的巴塞罗那);Xeon和Itanium 2垫底,内存带宽只有5.1/3.6GB/s,扩展性也是非常差,Xeon就只有43%

另外颇具讽刺意味的是,Itanium 2系统的功耗却是最高的,达500W之多,而Cell和Opteron相对最节能,分别只有285W和300W。新Xeon表现也不错,330W的功耗并不算高,而Niagara 2的450W就不低了。

前端总线的弊病:高性能计算表现不济
系统配置

前端总线的弊病:高性能计算表现不济
性能比较

前端总线的弊病:高性能计算表现不济
多核心扩展性能比较

前端总线的弊病:高性能计算表现不济
多核心扩展性能比较

格子Boltzmann模拟程序对系统内存带宽对需求非常高,因此使用前端总线技术的Intel处理器就处于不利地位了。在这次测试中,各方使用的内存配置分别是Intel FB-DIMM DDR2-667、AMD DDR2-667、Sun FB-DIMM DDR2-667、STI Rambus XDR。很显然,XDR的高频和高带宽优势非常明显,Intel的前端总线技术则存在很大的局限性。只有在Nehalem架构引入QPI互连总线、DDR3内存控制器之后,Intel处理器才有望摆脱这种困境。

结论很明显,如果你需要运行对内存带宽非常敏感的应用程序,那么Intel的Xeon和Itanium 2处理器绝对不是最佳选择,Cell、Niagara 2、Opteron都可以满足需求。当然了,对超级计算机的总体性能来说内存带宽只是一个方面,不是全部,因此也不能全盘否定前端总线技术。事实上在超级计算机领域,Intel的技术也是相当领先的,从超级计算机五百强中占据354个席位的统计上就可见一斑。

Intel方面拒绝就此发表评论,表示对论文里的内容不熟悉。

 

【本文结束】如需转载请务必注明出处:快科技

责任编辑:

  • 支持打赏
  • 支持0

  • 反对

  • 打赏

文章价值打分

当前文章打分0 分,共有0人打分
  • 分享好友:
  • |
本文收录在
#快讯

  • 热门文章
  • 换一波

  • 好物推荐
  • 换一波

  • 关注我们

  • 微博

    微博:快科技官方

    快科技官方微博
  • 今日头条

    今日头条:快科技

    带来硬件软件、手机数码最快资讯!
  • 抖音

    抖音:kkjcn

    科技快讯、手机开箱、产品体验、应用推荐...