正文内容 评论(0

NVIDIA推出CUDA 6 大大简化并行编程
2013-11-15 17:29:58   编辑:sunshine     评论(0)点击可以复制本篇文章的标题和链接

2013年11月14日—美国加利福尼亚州圣克拉拉—NVIDIA(英伟达™)今天发布了NVIDIA CUDA 6——全球最普遍的并行计算平台与编程模型的最新版本。

CUDA 6平台让并行编程变得比以往更加轻松,让软件开发商在利用GPU加速科学、工程、企业以及其它应用时能够大幅缩短所需时间和减少所耗费的精力。

它包含全新的性能增强内容,让开发者只需替换掉基于CPU的现有库,即可快速令应用程序速度提升8倍。CUDA 6的主要特性包括:

统一内存(Unified Memory)–让应用程序能够读写CPU与GPU存储器,无需在这二者之间手动复制数据,从而简化了编程。另外也让开发者能够更轻松地用各种编程语言在应用程序中添加对GPU加速的支持。

插入式库(Drop-in Libraries)–只需用GPU加速的库来替代现有的CPU库,即可自动加速应用程序的BLAS和FFTW运算,最高令其速度提升8倍。

多GPU 扩展–重新设计的BLAS和FFT GPU库最多能够在单一节点的8颗GPU上自动扩展性能,可实现每个节点9 Teraflops以上的双精度性能,支持比以往更大的工作负荷(最高512GB)。多GPU扩展还可以用在全新的BLAS插入式库上。

桑迪亚国家实验室可扩展算法部门经理 Rob Hoekstra 表示: “通过自动应付数据管理,统一内存让我们能够快速制作出在GPU上运行的内核原型并降低代码复杂度,从而最高可令开发用时缩短一半。当我们确定未来的编程模型选项并将更复杂、更大型的代码移植到GPU上时,这一功能将非常实用。”

Fabric Engine公司首席执行官Paul Doyle指出: “我们的技术现已帮助各大工作室、游戏开发商以及动画师制作出了视觉效果绝佳的3D动画与特效。这些客户一直催促我们添加对NVIDIA GPU加速的支持,然而实践证明,在处理复杂的制作场合时内存管理是一大难题。借助统一内存,内存管理实现了自动处理,从而让Fabric编译器能够针对NVIDIA GPU,让我们的客户能够实现最高10倍的应用程序速度提升。”

除了这些全新特性以外,CUDA 6平台还提供了一整套编程工具、GPU加速的数学库以及文档和编程指南。

CUDA Toolkit版本6预计将于2014年初问世。当它可供下载之时,CUDA-GPU计算注册开发者计划将会提醒大家。想要参加该项计划,敬请点此注册。

如需了解有关CUDA 6平台的更多信息,敬请于11月18-21日在丹佛举办的SC13大会上光临613号NVIDIA(英伟达™)展台、访问NVIDIA CUDA网站。

【本文结束】如需转载请务必注明出处:快科技

责任编辑:

  • 支持打赏
  • 支持0

  • 反对

  • 打赏

文章价值打分

当前文章打分0 分,共有0人打分
  • 分享好友:
  • |
本文收录在
#快讯

  • 热门文章
  • 换一波

  • 好物推荐
  • 换一波

  • 关注我们

  • 微博

    微博:快科技官方

    快科技官方微博
  • 今日头条

    今日头条:快科技

    带来硬件软件、手机数码最快资讯!
  • 抖音

    抖音:kkjcn

    科技快讯、手机开箱、产品体验、应用推荐...