NVIDIA百亿亿次超级计算芯片更深入细节--快科技--科技改变未来

当前位置：首页 > 资讯中心 > 电脑办公 > 显卡 > 文章详情

正文内容 评论（0）

NVIDIA百亿亿次超级计算芯片更深入细节

2010-11-25 17:12:30 出处：快科技作者：上方文Q 编辑：上方文Q 评论(0)

今年八月初，NVIDIA获得了美国国防部下属国防高级研究规划局(DARPA)的2500万美元专款支持，用于联合Cray、橡树岭国家实验室、六所美国顶尖大学共同研究基于GPU的百亿亿次(Exascale)高性能计算技术，速度千倍于目前最快的超级计算机系统。很快，NVIDIA就披露了他们的相关规划，项目代号“Echelon”。

NVIDIA架构研发主管Steve Keckler解释说，Echelon芯片的基本组成单位仍是流处理器(SP)，每八个组成一个流式多处理器阵列(SM)，双精度浮点性能大约160GFlops(每秒十亿次运算)；然后128个SM阵列并排，总计就是1024个流处理器，再辅以八个类似CPU的延迟优化核心，共同组成一颗大规模高性能计算芯片。

按照NVIDIA的设计，这样的一颗芯片能够带来20.48TFlops(每秒万亿次运算)的双精度浮点性能，可搭配256GB内存，带宽1.6TB/s。

相比之下，现在的Fermi(费米)架构在512个处理器、1544MHz频率下只有0.79TFlops的双精度浮点性能，这就意味着Echelon芯片必须实现25倍的浮点性能提升。再加上相应原型系统预计2018-2010年才能问世，其核心架构应该是下两代Kepler(开普勒)、Maxwell(麦克斯韦)之后的事儿了。

NVIDIA百亿亿次超级计算芯片更深入细节

NVIDIA百亿亿次超级计算芯片更深入细节

每颗Echelon芯片可以视为一个节点，进而四颗组成一个模块，然后32个模块再加上路由模块就组成一个机柜，合计性能高达2.56PFlops(每秒千万亿次运算)，内存容量32TB、带宽205TB/s。更进一步，这种机柜还可以继续多个并联，浮点性能自然也是继续直线上升。

NVIDIA同时表示，为了降低如此超大规模芯片的功耗，流处理器必须以不到10皮焦的耗电量处理一次双精度浮点操作，相当于费米架构的二十分之一，同时每个流处理器必须在单个时钟周期内完成四次浮点操作。

更进一步地，NVIDIA计划在芯片内集成1024个可配置的256KB SRAM Bank。如此大容量的片上内存能够尽可能地将数据保留在芯片内部，距离处理单元也尽可能的近，从而避免非常耗电的拾取操作。这些SRAM Bank既可以配置为通用内存池，也可以作为专用缓存。

NVIDIA百亿亿次超级计算芯片更深入细节

NVIDIA百亿亿次超级计算芯片更深入细节

Echelon现在还只是NVIDIA远景规划图上的一个设想，实现起来还有太多难题要解决，不止有硬件设计上的麻烦，还需要自我感应操作系统、自我感应运行时、位置感应编译器和调试器的软性配合。

有趣的是，美国国防部DARPA也同样找上了Intel，希望其能够从传统CPU的角度出发，同样实现百亿亿次高性能计算。Intel的计划是利用其正在研发的超多核心(MIC)架构，而且已经有了测试样品，甚至会在今年内推出相应的商用产品，似乎更快一步。

很显然，这是CPU、GPU之间的一场终极对决。

【本文结束】如需转载请务必注明出处：快科技

责任编辑：

相关资讯

支持打赏
支持0人
反对
打赏

文章价值打分

当前文章打分0 分，共有0人打分

0
0
0
打赏
|

分享好友:
分享至QQ
分享至微博
分享至QQ空间
|

生成海报

本文收录在

#快讯

热门文章

换一波

好物推荐

换一波

关注我们

微博：快科技官方
快科技官方微博
今日头条：快科技
带来硬件软件、手机数码最快资讯！
抖音：kkjcn
科技快讯、手机开箱、产品体验、应用推荐...

关于我们
关于我们
隐私权说明

交流合作
加入我们
意见反馈
广告刊例

关注我们
微信公众号：
微博号：快科技官方
QQ群：53467377

安卓客户端下载
IOS客户端下载

APP下载

手机扫码下载

支持Android/iOS/iPad
投稿
纠错

线索爆料

爆料群

爆料1群

打开微信扫一扫
扫描入群，加入爆料
意见反馈
评论
返回顶部