新闻中心

当前位置 > 新闻中心> IT业界 > 企业动态 > NVIDIA Tesla P100令高性能计算应用程序加速...
NVIDIA Tesla P100令高性能计算应用程序加速30倍以上
2016-06-20 18:07:45  作者:sunshine 编辑:sunshine   点击可以复制本篇文章的标题和链接
 
让小伙伴们也看看:
收藏文章

2016年6月20日—德国法兰克福—2016 年国际超级计算大会 — 为满足人们对现代数据中心前所未有的计算需求,NVIDIA 今天推出了适用于 PCIe 服务器的 NVIDIA® Tesla® P100 GPU 加速器,与 CPU 系统相比,该产品可实现性能与性价比的巨大飞跃。

现在人们对超级计算的需求高于以往任何时候。美国国家科学基金会的数据显示,大多数科学家无法在超级计算系统上获得足够的使用时间来完成其研究项目。此外,计算量繁重的深度学习应用程序越来越需要使用高性能计算 (HPC) 技术,研究人员正在运用人工智能技术来推动传统科学领域的进步。

PCIe 型 Tesla P100 GPU 加速器具备 NVIDIA Pascal™ GPU 架构无与伦比的性能与节能性,能够满足这些计算需求。它让人们能够创建“超级节点”,其吞吐量与 32 个以上的市售 CPU 节点相当,可令投资与运营成本节省 70%。

NVIDIA 加速型计算副总裁 Ian Buck 表示:“想要在高性能计算与人工智能超级计算方面满足研究人员不断增长的需求,加速型计算是必由之路。如果通过部署纯 CPU 系统来满足这一需求,则需要购置大量的市售计算节点,这会导致成本大幅提升的同时,性能却没有相应地大幅提升。如果使用性能更高的 Tesla P100 节点,那么需要的节点数量更少,而且可以大幅扩展性能,如此一来,客户便能够把钱更多地花费在计算上,而非花在基础设施上。”

PCIe 型 Tesla P100 采用标准的 PCIe 卡型设计,兼容当今的 GPU 加速型服务器。该产品经过专门优化,能够运行那些计算量最为繁重的人工智能与高性能计算数据中心应用程序。当运行 AMBER 分子动力学程序时,单台 Tesla P100 服务器的性能胜过 50 个纯 CPU 服务器节点,当运行 VASP 材料科学应用程序时,其性能胜过 32 个纯 CPU 节点。

今年晚些时候,升级版的 Piz Daint 系统将采用 PCIe 型 Tesla P100 加速器。该系统位于瑞士卢加诺瑞士国家超级计算中心,是欧洲最快的超级计算机。

苏黎世联邦理工学院计算物理学教授兼瑞士国家超级计算中心主任 Thomas Schulthess 表示:“Tesla P100 加速器可带来全新级别的性能与效率,能够解决当今最重要的一些计算难题。在 Piz Daint 上,4,500 个 GPU 加速型节点将升级至 Tesla P100 GPU,此举将使该系统的性能翻一番以上,进而让研究人员能够在各种领域中实现突破,其中包括宇宙学、材料科学、地震学以及气候学等等。”

PCIe 型 Tesla P100 是 NVIDIA Tesla 加速型计算平台系列中的最新产品。主要特性包括:

在处理混合型高性能计算任务方面可带来无与伦比的应用程序性能 — 双精度和单精度峰值性能分别为 4.7 Teraflops 和 9.3 Teraflops,基于 Pascal 架构的单个 Tesla P100 节点在性能方面相当于 32 台以上的市售纯 CPU 服务器。

CoWoS 搭配 HBM2,可实现前所未有的效率 — Tesla P100 将处理器与数据统一到单一封装内,可带来前所未有的计算效率。基板上晶圆上芯片封装 (CoWoS) 搭配 HBM2 是一种创新的内存设计方式,与 NVIDIA Maxwell™ 架构相比可令内存带宽性能提升 3 倍,达到 720GB/秒。

页面迁移引擎可简化并行编程 — 让开发人员能够把更多的精力放在优化性能上,而非管理数据传输上。支持虚拟内存分页,让应用程序的大小能够超出 GPU 的物理内存容量。统一内存技术通过让开发人员能够将整个节点看作单一内存空间,从而可大幅提升生产率。

无与伦比的应用程序支持 — Tesla 平台是全球领先的高性能计算平台,该平台上有 410 款 GPU 加速型应用程序,其中包括 10 款顶级高性能计算应用程序中的 9 款。

PCIe 型 Tesla P100 的规格参数

支持 NVIDIA GPU BOOST™ 技术,双精度性能高达 4.7 Teraflops、单精度性能高达 9.3 Teraflops、半精度性能高达 18.7 Teraflops

支持第三代 PCIe 互联 (双向带宽高达32GB/秒)

页面迁移引擎与统一内存能够增强可编程性

ECC 保护可带来更高的可靠性

针对服务器而优化,可带来最高的数据中心吞吐量和可靠性

有两种配置可供选择:

o16GB CoWoS HBM2 堆栈式内存,内存带宽高达 720GB/秒

o12GB CoWoS HBM2 堆栈式内存,内存带宽高达 540GB/秒

文章纠错

微信公众号搜索" 驱动之家 "加关注,每日最新的手机、电脑、汽车、智能硬件信息可以让你一手全掌握。推荐关注!【微信扫描下图可直接关注

阅读更多:默认

好文共享:
收藏文章

文章观点支持

文章价值打分
当前文章打分0 分,共有0人打分
热门评论
热门文章