正文内容 评论(0)
来自美国加州大学伯克利分校科学计算部门、劳伦斯伯克利国家实验室的研究人员们最近向IEEE递交了一份报告,在其中探讨了多核心超级计算机架构在格子Boltzmann模拟优化项目上的可扩展性。IEEE认为报告非常精彩,甚至可以颁个奖,不过Intel看到报告可能不会太高兴:至少在这次的考察中,Xeon和Itanium 2处理器表现非常一般,Cell BE则是最好的。
这次对比的处理器包括AMD Santa Rosa Opteron、Intel Clovertown Xeon/Itanium 2、Sun Niagara 2、索尼-东芝-IBM(STI) Cell BE,均为多核心架构产物。研究人员们首先对模拟程序本身进行了深入优化,据称可比原来的LBMHD代码提速14倍之多。
根据这份报告得出的结论,Cell BE的高性能计算表现最好,比如计算能力16.7GFlops、内存带宽16.7GB/s,多核心扩展性几乎是100%;接下来是Niagara 2和Opteron,借助HyperTransport总线技术,Opteron的扩展性也接近于线性(遗憾的是这里只测试了双核心Opteron,没有四核心的巴塞罗那);Xeon和Itanium 2垫底,内存带宽只有5.1/3.6GB/s,扩展性也是非常差,Xeon就只有43%。
另外颇具讽刺意味的是,Itanium 2系统的功耗却是最高的,达500W之多,而Cell和Opteron相对最节能,分别只有285W和300W。新Xeon表现也不错,330W的功耗并不算高,而Niagara 2的450W就不低了。
格子Boltzmann模拟程序对系统内存带宽对需求非常高,因此使用前端总线技术的Intel处理器就处于不利地位了。在这次测试中,各方使用的内存配置分别是Intel FB-DIMM DDR2-667、AMD DDR2-667、Sun FB-DIMM DDR2-667、STI Rambus XDR。很显然,XDR的高频和高带宽优势非常明显,Intel的前端总线技术则存在很大的局限性。只有在Nehalem架构引入QPI互连总线、DDR3内存控制器之后,Intel处理器才有望摆脱这种困境。
结论很明显,如果你需要运行对内存带宽非常敏感的应用程序,那么Intel的Xeon和Itanium 2处理器绝对不是最佳选择,Cell、Niagara 2、Opteron都可以满足需求。当然了,对超级计算机的总体性能来说内存带宽只是一个方面,不是全部,因此也不能全盘否定前端总线技术。事实上在超级计算机领域,Intel的技术也是相当领先的,从超级计算机五百强中占据354个席位的统计上就可见一斑。
Intel方面拒绝就此发表评论,表示对论文里的内容不熟悉。
本文收录在
#快讯
- 热门文章
- 换一波
- 好物推荐
- 换一波
- 关注我们
-
微博:快科技官方
快科技官方微博 -
今日头条:快科技
带来硬件软件、手机数码最快资讯! -
抖音:kkjcn
科技快讯、手机开箱、产品体验、应用推荐...