正文内容 评论(0)
为下一代 AI 基础设施实现突破性机架级性能、扩展性和效率
Arm 今日正式发布 Arm AGI CPU,该产品是基于 Arm Neoverse 平台打造的全新量产级芯片,旨在为下一代人工智能 (AI) 基础设施提供核心算力支撑。
在公司超过 35 年的发展历程中,Arm 首次推出自己的芯片产品,将 Arm Neoverse 平台从 IP 和计算子系统 (Compute Subsystems, CSS) 进一步拓展,为客户提供更丰富的 Arm 解决方案:既可自主打造定制化芯片,也可集成平台级方案,或直接部署 Arm 自主设计的芯片。这一产品战略的升级既反映了 AI 基础设施的快速演进,也满足了生态伙伴对可快速规模化部署的量产级 Arm 平台的迫切需求。
代理式 AI 基础设施崛起
AI 系统正日益以全球规模持续运行。在过去,人是计算环节的瓶颈——人们与系统的交互速度决定了工作推进的速度。而在代理式 AI 时代,因为软件智能体可自主协同任务、与多个模型交互,并实时做出决策,这种局限性将不复存在。
随着 AI 系统持续运行且工作负载复杂度不断提升,CPU 已成为现代基础设施中决定运行节奏的关键要素——负责保持分布式 AI 系统大规模的高效运行。在现下的 AI 数据中心中,CPU 管理数千个分布式任务,包括协调加速器、管理内存与存储、调度工作负载、跨系统迁移数据,加上当今的代理式 AI 场景兴起,CPU 还需面向海量智能体实现大规模协同调度。
这一转变对 CPU 提出了全新要求,驱动处理器架构的演进。
Arm Neoverse 现已成为当今众多领先超大规模云服务及 AI 平台的核心支撑,包括 Amazon Graviton、Google Axion、Microsoft Azure Cobalt 及 NVIDIA Vera 等。随着 AI 基础设施在全球范围内不断扩展,生态系统的合作伙伴纷纷期待 Arm 能够提供更多能力。为应对这一变革,Arm AGI CPU 应运而生。
Arm AGI CPU:专为机架级代理式 AI 效率而生
代理式 AI 工作负载需要在大规模场景下实现持续稳定的性能输出。Arm AGI CPU 正是为此而设计,能够在数千核心并行的持续高负载下,为每个任务提供高性能表现,且满足现代数据中心功耗与散热的严格要求。
从运行频率到内存及 I/O 架构,Arm AGI CPU 的每一处设计都经过专门优化,在高密度机架部署场景下,支持大规模并行、高性能的代理式 AI 工作负载。
Arm 的参考服务器采用 1OU 双节点设计,每台刀片服务器中集成两颗 CPU 芯片,并配备独立内存与 I/O,共计 272 个核心。这些刀片服务器可在标准风冷 36 千瓦 (kW) 机架中满配部署,30 台刀片服务器可提供总计 8,160 个核心。此外,Arm 还与 Supermicro 合作推出 200 千瓦 (kW) 液冷设计方案,可容纳 336 颗 Arm AGI CPU,提供超过 45,000 个核心。
在该配置下,凭借 Arm 架构的根本优势,以及系统资源与计算能力的精准匹配,Arm AGI CPU 可实现单机架性能达到最新 x86 系统的两倍以上*:
Arm AGI CPU 具备业界领先的内存带宽,使每个机架能够支持更多高效执行的线程;相比之下,x86 CPU 在持续高负载下会因核心争抢资源而导致性能下降;高性能、高能效的单线程 Arm Neoverse V3 处理器核心性能出众,优于传统架构——每个 Arm 线程可处理更多任务;更多可用线程与更高单线程处理能力相互叠加,最终实现单机架性能的大幅提升。
来自 AI 生态系统的开局势头
Arm AGI CPU 已获得合作伙伴的强劲商业认可,这些合作伙伴均处于代理式 AI 基础设施规模化部署的前沿领域。计划部署场景涵盖加速器管理、代理式 AI 协同调度,以及支撑代理式 AI 任务规模化扩展所需的服务、应用与工具的高密度部署,同时还包括为 AI 数据中心提供更强的网络与数据面计算能力。
Meta 作为 Arm AGI CPU 的早期合作伙伴与客户,参与该 CPU 的联合开发,旨在为 Meta 全系应用优化吉瓦级规模基础设施,并与 Meta 自研的 MTIA 加速器协同运行。其他首发合作伙伴包括 Cerebras、Cloudflare、F5、OpenAI、Positron、Rebellions、SAP 及 SK 电讯——这些企业均与 Arm 合作部署 Arm AGI CPU,以加速云、网络及企业环境中的 AI 驱动型服务落地。目前,永擎电子、联想及 Supermicro 已开放商用系统订购。
为进一步加速产品采用,Arm 推出 Arm AGI CPU 1OU 双节点参考服务器,该服务器采用符合开放计算项目 (Open Compute Project, OCP) 的 DC-MHS 标准规格设计。Arm 计划向社区贡献该参考服务器设计方案及配套固件,并进一步提供包括系统架构规范、调试框架及适用于所有 Arm 架构系统的诊断与验证工具等资源。更多细节将在即将举办的 OCP EMEA 峰会上公布。
Arm 基础设施的全新篇章
Arm AGI CPU 的发布,开启了 Arm 数据中心业务发展的全新篇章,也彰显了其在计算创新领域的持续领导力。随着 AI 重塑行业格局,Arm 始终致力于赋能生态系统的发展——满足各类客户的实际需求,覆盖从超大规模云服务提供商到 AI 初创企业。
Arm AGI CPU 是 Arm 全新数据中心芯片产品线的首款产品,现已开放订购。其后续产品规划也已确认,致力于实现业界领先的性能、扩展性与能效。该产品线将与 Arm Neoverse CSS 产品路线图并行推进,确保所有 Arm 数据中心客户在平台架构与软件兼容性方面实现协同发展。
翻开这一全新篇章,我们的使命始终如一:打造坚实的计算基石,助力各行业实现创新。如今,整个生态系统与我们并肩同行——超大规模计算服务商、云计算、芯片、内存、网络、软件、系统设计与制造等领域的 50 余家领军企业,均对 Arm 计算平台向芯片领域拓展表示支持。凭借 Arm AGI CPU,Arm 不仅在定义 AI 原生数据中心的架构,更在将它构建成为现实。
部署 Arm AGI CPU 的合作伙伴证言
Cerebras
“Cerebras 专注于打造面向超高速、大规模推理的 AI 基础设施。随着大规模推理成为 AI 领域的主流工作负载,可组合的高性能系统变得愈发重要——这类系统既需要定制化 AI 加速能力,也需要高效、可扩展的 CPU 来规模化协调数据迁移、网络连接与协同调度。Arm 计算平台向 AGI 级基础设施的拓展,对生态系统和在全球范围内大规模部署 AI 的客户而言,都是极具积极意义的一步。”
Cerebras 首席执行官 Andrew Feldman
Cloudflare
“为持续践行‘助力构建更美好的互联网’这一使命,Cloudflare 需要能够在全球网络中高效扩展的基础设施。Arm AGI CPU 能为下一代工作负载提供所需的高性能、高能效计算能力。”
Cloudflare 首席战略官 Stephanie Cohen
Meta
“要在全球规模化提供 AI 体验,需要一套稳健、可适配性的定制化芯片解决方案,专为加速 AI 工作负载、优化 Meta 全平台的性能而打造。我们与 Arm 携手开发 Arm AGI CPU,以部署一套高效的计算平台,在显著提升数据中心性能密度的同时,为我们持续演进的 AI 系统构建跨多代产品的技术发展路线图。”
Meta 基础设施负责人 Santosh Janardhan
OpenAI
“OpenAI 运行着超大规模的人工智能系统。每天有数亿用户使用 ChatGPT,企业基于我们的 API 构建应用,开发者依赖 Codex 等工具开展工作。随着我们的业务持续扩展,Arm AGI CPU 将在基础设施中发挥重要作用——强化调度层以协调大规模 AI 工作负载,并全面提升系统的效率、性能与带宽。”
OpenAI 工业计算负责人 Sachin Katti
Positron
“Positron 专注于打造定制化推理加速器,通过通用内存实现突破性的词元 (token) 生成效率。Arm 始终致力于提供业界能效最优的计算平台,这使得 Arm AGI CPU 成为下一代 AI 基础设施的理想基石。通过将 Positron 的推理加速技术与高能效的 Arm AGI CPU 平台相结合,我们有望帮助数据中心运营商以更优的每瓦性能与每美元性能,规模化部署前沿 AI 模型。”
Positron 首席执行官 Mitesh Agrawal
Rebellions
“高性能 AI 系统需要通用计算与加速器架构的紧密协同。通过在全新高密度服务器配置中整合 Arm AGI CPU 与 Rebellions 的神经网络处理器 (NPU),我们将打造一个可扩展、高能效的平台,专为大规模 AI 推理工作负载进行优化。”
Rebellions 首席商务官 Marshall Choy
SAP
“SAP 在基于 Arm 架构的 Amazon Graviton 上成功部署 SAP HANA,充分印证了 Arm 生态在企业级工作负载场景下的成熟度与出色性能。Arm AGI CPU 进一步拓展了这一潜力,提供可扩展、高能效的计算能力,为下一代 AI 驱动的企业级解决方案提供有力支撑。”
SAP 高级副总裁、HANA 及持久化业务负责人 Stefan Bäuerle
SK 电讯
“SK 电讯正在拓展大规模全栈 AI 推理数据中心基础设施,其中即包含 Arm AGI CPU 及 Rebellions AI 加速芯片。通过将我们自主研发的 A.X 基础模型与推理优化型 AI 服务器相结合,我们已准备好向全球交付相关服务,同时提升自身 AI 数据中心的竞争力。”
SK 电讯首席技术官兼 AI CIC 负责人 Suk-geun (SG) Chung
本文收录在
#快讯
- 热门文章
- 换一波
- 好物推荐
- 换一波
- 关注我们
-
微博:快科技官方
快科技官方微博 -
今日头条:快科技
带来硬件软件、手机数码最快资讯! -
抖音:kkjcn
科技快讯、手机开箱、产品体验、应用推荐...
