正文内容 评论(0)
快科技5月21日消息,Ampere Computing发布了最新一代云数据中心处理器“AmpereOne”,是业界第一款192核心的通用目的CPU处理器。
它采用台积电5nm工艺制造,基于Armv8.6+指令集自研的架构,核心数量可选136个、144个、160个、172个、192个(上代Ampere Altra 32-128个),稳定频率最高3.0GHz。
每核心集成两个128位矢量单元,支持FP16、BF16、INT16、INT8数据格式。
每核心16KB一级指令缓存、64KB一级数据缓存、2MB二级缓存(上代1MB),同时所有核心共享64MB三级缓存。
内存支持八通道DDR5 ECC(上代八通道DDR4),单系统最多16条,最大容量8TB。
扩展支持128条PCIe 5.0(上代128条PCIe 4.0),来自32个控制器。
功耗范围200-350W,对比上代的10-180W增加了不少。
性能方面,Ampere对比了AMD、Intel x86平台,但有点另类。
一是对比支持的虚拟机数量,42U 16.5千瓦机架空间内,AmpereOne可多达7296个,AMD霄龙9654 Genoa、Intel至强8480+ Sapphire Rapids则分别只有2496个、1680个。
但事实上,42U机架的功耗空间已经开放了很多,很多都已经增至20-50千瓦,这对于AMD、Intel当然更加有利,但是被Ampere刻意回避了。
二是对比AI性能,Stable Diffusion、DLRM两个项目,号称相比AMD霄龙9654分别领先2.3倍、2倍。
但事实上,Ampere使用的是FP16精度,AMD则是FP32精度,并不公平,更何况FP16精度负载大多都已经交给GPU执行了。