NVIDIA正式宣布CUDA 6：支持统一寻址！--快科技--科技改变未来

正文内容 评论（0）

NVIDIA正式宣布CUDA 6：支持统一寻址！

2013-11-15 10:43:16 出处：快科技作者：上方文Q 编辑：上方文Q 评论(0)

#NVIDIA #显卡

NVIDIA今天正式宣布了最新版并行计算开发工具CUDA 6，相比此前的CUDA 5.5有着革命性的巨大进步。

NVIDIA表示，CUDA 6可以让并行编程前所未有的轻松，能够显著节省开发人员的时间和精力，而通过GPU加速可带来最多8倍于CPU模式的性能提升。

CUDA 6的关键新特性包括：

1、统一寻址(Unified Memory)：

可直接访问CPU内存、GPU显存，无需在彼此之间手动拷贝数据，可在大量编程语言中更简单地添加GPU加速支持。

其实CUDA 4就开始支持统一虚拟寻址，x86 CPU、GPU内存池可在同一空间内进行寻址，但那仅仅是简单的内存管理，摆脱不了手动数据转移。

CUDA 6则在现有的内存池结构上增加了一个统一内存系统，程序员可以直接访问任何内存/显存资源，或者在合法的内存空间内寻址，而不用管涉及到的到底是内存还是显存。

不过注意，CUDA 6并不是完全不需要数据拷贝，只不过将这个工作从程序员那里接过来自动执行而已，它仍然受制于PCI-E的带宽和延迟，因此和AMD hUMA异构统一寻址架构是不一样的。

NVIDIA的统一内存寻址

简化的内存管理代码

另外值得一提的是，NVIDIA此前已经宣布下代GPU Maxwell将会支持统一虚拟内存，但它要到明年才会发布。NVIDIA表示，他们找到了完全通过软件执行统一内存的方法，所以就提前这么做了，Maxwell则会有某种硬件层面的统一内存技术(或许性能更高)，但具体细节还有待公布。

2、插入式库(Drop-in Libraries)：

简单地用GPU加速库替换已有的CPU库，BLAS(基础线性代数程序集)、FFTW(快速傅立叶变换)计算即自动提速最多8倍。

3、多GPU扩展(Multi-GPU Scaling)：

重新设计的BLAS、FFT GPU库，单个节点可自动支持最多八颗GPU，双精度浮点性能可超过9TFlops，并且支持最多512GB的更大负载。

此外，CUDA 6平台还会提供一整套的编程工具、GPU加速数学库、文档和编程指导。

CUDA 6目前只是纸面宣布，2014年初才会开放下载。有需要的可注册加入CUDA-GPU开发者项目。

【本文结束】如需转载请务必注明出处：快科技

责任编辑：

文章价值打分

当前文章打分0 分，共有0人打分

0
0
0
打赏
|

分享好友:
分享至QQ
分享至微博
分享至QQ空间
|

生成海报

本文收录在

#NVIDIA #显卡

好物推荐

换一波

关注我们

微博：快科技官方
快科技官方微博
今日头条：快科技
带来硬件软件、手机数码最快资讯！
抖音：kkjcn
科技快讯、手机开箱、产品体验、应用推荐...

正文内容 评论（0）

相关资讯

文章价值打分

本文收录在

热门文章

换一波

好物推荐

换一波

关注我们

微博：快科技官方

今日头条：快科技

抖音：kkjcn

热点推荐

好物推荐

图片信息

正文内容 评论（0）

相关资讯

文章价值打分

本文收录在

热门文章 换一波

好物推荐 换一波

关注我们

微博：快科技官方

今日头条：快科技

抖音：kkjcn

热点推荐

好物推荐

图片信息

正文内容评论（0）

热门文章

换一波

好物推荐

换一波