NVIDIA推出CUDA 6 大大简化并行编程--快科技--科技改变未来

正文内容 评论（0）

NVIDIA推出CUDA 6 大大简化并行编程

2013-11-15 17:29:58 编辑：sunshine 评论(0)

#快讯

2013年11月14日—美国加利福尼亚州圣克拉拉—NVIDIA（英伟达™）今天发布了NVIDIA CUDA 6——全球最普遍的并行计算平台与编程模型的最新版本。

CUDA 6平台让并行编程变得比以往更加轻松，让软件开发商在利用GPU加速科学、工程、企业以及其它应用时能够大幅缩短所需时间和减少所耗费的精力。

它包含全新的性能增强内容，让开发者只需替换掉基于CPU的现有库，即可快速令应用程序速度提升8倍。CUDA 6的主要特性包括:

统一内存(Unified Memory)–让应用程序能够读写CPU与GPU存储器，无需在这二者之间手动复制数据，从而简化了编程。另外也让开发者能够更轻松地用各种编程语言在应用程序中添加对GPU加速的支持。

插入式库(Drop-in Libraries)–只需用GPU加速的库来替代现有的CPU库，即可自动加速应用程序的BLAS和FFTW运算，最高令其速度提升8倍。

多GPU 扩展–重新设计的BLAS和FFT GPU库最多能够在单一节点的8颗GPU上自动扩展性能，可实现每个节点9 Teraflops以上的双精度性能，支持比以往更大的工作负荷(最高512GB)。多GPU扩展还可以用在全新的BLAS插入式库上。

桑迪亚国家实验室可扩展算法部门经理 Rob Hoekstra 表示: “通过自动应付数据管理，统一内存让我们能够快速制作出在GPU上运行的内核原型并降低代码复杂度，从而最高可令开发用时缩短一半。当我们确定未来的编程模型选项并将更复杂、更大型的代码移植到GPU上时，这一功能将非常实用。”

Fabric Engine公司首席执行官Paul Doyle指出: “我们的技术现已帮助各大工作室、游戏开发商以及动画师制作出了视觉效果绝佳的3D动画与特效。这些客户一直催促我们添加对NVIDIA GPU加速的支持，然而实践证明，在处理复杂的制作场合时内存管理是一大难题。借助统一内存，内存管理实现了自动处理，从而让Fabric编译器能够针对NVIDIA GPU，让我们的客户能够实现最高10倍的应用程序速度提升。”

除了这些全新特性以外，CUDA 6平台还提供了一整套编程工具、GPU加速的数学库以及文档和编程指南。

CUDA Toolkit版本6预计将于2014年初问世。当它可供下载之时，CUDA-GPU计算注册开发者计划将会提醒大家。想要参加该项计划，敬请点此注册。

如需了解有关CUDA 6平台的更多信息，敬请于11月18-21日在丹佛举办的SC13大会上光临613号NVIDIA（英伟达™）展台、访问NVIDIA CUDA网站。

【本文结束】如需转载请务必注明出处：快科技

责任编辑：