正文内容 评论(0

不用独显也能跑AI Intel和AMD罕见达成共识
2026-06-22 10:45:29  出处:快科技 作者:知微 编辑:知微     评论(0)点击可以复制本篇文章的标题和链接复制对文章内容进行纠错纠错

快科技6月22日消息,Intel与AMD共同发布完整ACE CPU扩展规范,这套面向AI运算的全新指令集落地x86架构,通过优化矩阵乘法实现更高能效与计算密度,大幅降低CPU本地运行AI模型的门槛。

日常AI推理大多依靠GPU完成,但轻量化模型、低延迟任务或是无独显设备,更适合直接在CPU运行,但传统AVX10向量指令并非为矩阵运算打造,执行AI核心矩阵乘法时功耗高、效率偏低。

ACE基于现有AVX10寄存器拓展,新增专用硬件单元处理矩阵计算,无需重新设计底层架构,厂商适配成本更低。

官方数据显示,同等输入向量规模下,ACE计算密度是AVX10的16倍,单条指令可完成更多计算,减少指令调度开销,内存带宽利用率同步提升,同时功耗控制更出色,不过16倍计算密度不代表直接16倍提速,最终性能取决于两家处理器后续硬件设计。

该指令集跨厂商通用,开发者仅需编写一套代码,就能适配Intel、AMD全系支持ACE的CPU,不用针对不同AVX版本做多套适配,PyTorch、TensorFlow等主流AI框架均可无缝兼容,数据格式覆盖 INT8、FP8、BF16等AI常用类型,还原生支持OCP MX块缩放格式,填补AVX10的功能空白。

对于开发者而言,部分临时NPU算力需求可转移至CPU处理,无需适配各家规格不一的 NPU硬件,未来新一代x86处理器将搭载ACE扩展,笔记本、台式机、服务器无需依赖独显,就能流畅运行各类本地 AI 任务,进一步拓宽端侧AI落地场景。

不用独显也能跑AI  Intel和AMD罕见达成共识

【本文结束】如需转载请务必注明出处:快科技

责任编辑:知微

文章内容举报

  • 支持打赏
  • 支持0

  • 反对

  • 打赏

文章价值打分

当前文章打分0 分,共有0人打分
  • 分享好友:
  • |

  • 热门文章
  • 换一波

  • 好物推荐
  • 换一波

  • 关注我们

  • 微博

    微博:快科技官方

    快科技官方微博
  • 今日头条

    今日头条:快科技

    带来硬件软件、手机数码最快资讯!
  • 抖音

    抖音:kkjcn

    科技快讯、手机开箱、产品体验、应用推荐...