去年11月的超级计算大会SC15上,AMD提出了“玻尔兹曼计划”(Boltzmann Initiative),重构了自己的整个HPC高性能计算软件平台,向着NVIDIA CUDA发起强有力的冲击,尤其是可以直接将CUDA编译代码直接转换过来。
今年4月份,这一项目被正式命名为“Radeon开放计算平台”(Radeon Open Compute Platform),简称ROCm,并发布了1.0版本,支持Fiji GPU、P2P RDMA。
ROCm 1.1版本在6月推出,支持多GPU;8月升级为1.2版本,支持Hawaii GPU、LLVM原生编译器也进入Beta测试阶段。
最新一届的超算大会SC16上,ROCm 1.3登场了,变化极大,异构计算编译器(HCC)、异构计算可移植界面(HIP)都有重大进展,可以说AMD的宏伟规划已经基本成型。
LLVM原生编译器现在基本已经视为正式版本了,它和相关驱动、API、接口也是整个ROCm平台的支柱。
ROCm 1.3也引入了不少新特性,现在支持16位浮点和整数格式(GCN 1.3 Tonga/Fiji及之后的硬件支持)、OpenCL 1.2+、Polaris家族显卡(RX 400/Pro WX系列)、Ubuntu 16.04/Fedora 24操作系统。
处理器方面,除了支持Intel、AMD x86平台(包括未来的Zen),还将支持ARMv8 AArch64、IBM POWER8,尤其后者直接杀入了NVIDIA的地盘。
实际效果如何呢?AMD在大会上展示了从CUDA向HIP一直深度学习框架CAFFE,5.5万行代码只用了不到4天,99.6%都是自动移植完成,并且软件运行甚至比OpenCL版本还要快。
期待明年的SC17大会上带来更多惊喜。