正文内容 评论(0)
首次宣布一周之后,NVIDIA今天公开发布了GPU通用计算开发包的CUDA 4.0 RC候选版,并提供给开发人员下载使用。
如果你是一位GPU计算开发人员,或者对这方面有兴趣,可以在NVIDIA官方网站上注册并获得这个新的开发包,地址为:
http://developer.nvidia.com/object/cuda_4_0_RC_downloads.html
CUDA 4.0作为一个全新版本,功能特性自然增加了不少,主要涉及应用程序移植的简化、多GPU编程的加速、开发工具的增加和改进三个方面。下边我们就结合NVIDIA的官方演示文稿,一起看看CUDA 4.0的新特性。
从超级手机到超级计算机:NVIDIA正在将自己定位成一家“超级”计算公司,CUDA 4.0就是这条路上的重要里程碑。
CUDA发展之路:2007年1.0版,只有研究人员和一些尝鲜者体验;次年升级为2.0版,吸引了科学家和高性能计算领域;2009年3.0版,掀起了应用程序创新的风潮;如今4.0版诞生,意味着将有更广泛的开发人员加入CUDA阵营。
CUDA 4.0三大进步:应用程序移植的简化、多GPU编程的加速、开发工具的增加和改进。
为了简化应用程序的移植,CUDA 4.0带来了统一虚拟寻址(UVA)、GPUDirect 2.0、Thrust C++模板化算法与数据结构。
CUDA 4.0支持多个线程共享一个或者多个GPU,同时单个主线程也可以访问所有GPU,可以充分发挥多GPU的联合优势,即使是单线程程序也能从多GPU中获得更好性能。
无需拷贝的映射机制(No-copy Pinning),减少系统内存占用、避免过载,并且支持Windows、Linux系统和所有CUDA GPU。