在GTC 2017大上,NVIDIA正式发布了史上最强大的核弹--旗舰计算卡Tesla V100。
Tesla V100是基于Volta架构的产品,内置了5120个CUDA单元,核心频率为1455MHz,搭载16GB HBM2显存,单精度浮点性能15 TFLOPS,双精度浮点7.5 TFLOPS,显存带宽900GB/s。
此外,Tesla V100还增加与深度学习高度相关的Tensor单元,Tensor性能号称可以达到120 TFLOPS。如此“堆料”让Tesla V100拥有超过210亿个晶体管,核心面积达到了创纪录的815平方毫米,采用的是12nmFFN工艺制造(其实是16nm深度改良)。
作为对比,上代旗舰Tesla P100不过只有3584个CUDA核心,拥有153亿个晶体管,核心面积610平方毫米(16nm FET+工艺)。同时,Tesla V100的二级缓存及寄存器大小也有所增加,L2缓存由Tesla P100的4096KB增加到了6144KB,每组SM单元的寄存器文件大小总数从14336KB增加到了20480KB。
NVIDIA表示,Tesla V100将首先用在用于深度学习超算DGX-1上,内部拥有8张Tesla V100计算卡,峰值计算性能高达960 TFLOPS,号称用8个小时就能完成TITAN X八天的工作量。
价格方面,DGX-1的售价为14.9万美元,约合人民币102万元。