高通骁龙处理器集成了神经处理引擎SDK,苹果A11仿生处理器加入了神经网络引擎,华为麒麟970整合了全新的NPU神经网络计算单元,而按照现在的行业形势,AI在移动平台上显然只是刚开始。
近日,全球顶级移动GPU厂商Imagination,就发布了全新的PowerVR Series 2NX神经网络加速器(NNA),可用于神经网络的高性能计算,而且核心面积超小、功耗超低。
PowerVR 2NX号称是目前最高效率的移动AI方案,基于从零设计、独立式的硬件IP全新架构,拥有业内最低的功耗、最高的能效比(单位毫瓦推理inference/mW)、最高的单位面积性能(单位面积推理inference/mm2)、最高的性价比。
它对内存带宽的需求也是业界最低的,最低4-bit位宽即可满足,只相当于对手的25-50%,同时相比于8-bit性能提升60%、功耗降低69%,相对精度只损失不到1%。
Imagination宣称,它的性能也是业界领先的,单个核心每时钟周期就能提供2048 MAC,并支持多核心扩展,是对手的2倍(但没说具体是哪个对手),同时与单纯的DSP解决方案相比,可提供8倍的性能密度提升。
PowerVR 2NX的特色在于可以同时支持CNN、RNN、LSTM三种神经网络类型,并且支持caff、caffe2、Google TensorFlow等通用机器学习体系架构,还支持可适用于移动端的TensorFlow Lite、caffe2go等机器学习体系架构。
因此,它可用于移动、监控、汽车、消费等众多领域,并以非常低的功耗实现神经网络的高性能运算。
Imagination也举了很多应用实例,包括AR/VR头戴设备中的特征检测与眼球追踪;汽车安全系统中的行人检测与驾驶员警觉性监控;智能监控系统中的脸部辨识与人群行为分析;网络诈欺检测、内容建议、预测性UX;虚拟助理应用中的语音识别与回应;无人机中的防撞与对象追踪等。
比如说照片识别,高端GPU对1000张照片进行搜索/排序大约需要60秒;消耗1%的电量,可以对2400张照片排序,或者分析1分钟20秒长的视频。
而如果采用PowerVR 2NX,前者只需2秒,后者可处理428000张照片或237分钟视频。