马斯克的xAI坐拥55万张英伟达GPU加速卡利用率仅11% --快科技--科技改变未来

正文内容 评论（0）

马斯克的xAI坐拥55万张英伟达GPU加速卡利用率仅11%

2026-05-05 11:49:17 出处：快科技作者：秋白编辑：秋白评论(0)

复制

纠错

#GPU #xAI

快科技5月5日消息，坐拥约55万块英伟达GPU，实际算力利用率仅有11%，这一巨大反差让马斯克旗下 xAI 近期推向舆论风口浪尖，也引发业界对其算力利用效率的广泛质疑。

据外媒《The Information》获取的xAI内部备忘录显示，xAI公司总裁迈克尔·尼科尔斯（Michael Nicolls）向团队坦言，目前公司模型浮点运算利用率（MFU）约为11%。

这一数字背后的含义十分直观：理论上可输出100份训练算力的硬件，实际仅能产出11份，尼科尔斯在备忘录中直白评价其“低得尴尬”，并明确为团队设定了目标——未来几个月内将这一利用率拉升至50%。

据悉，xAI目前拥有约55万颗NVIDIA GPU，涵盖H100和H200系列。尽管这些GPU比最新的Blackwell产品落后了一个世代，但如此庞大的硬件部署规模，仍给市场留下了深刻印象。

需要指出的是，11%这个数字，并非指89%的GPU在完全闲置，而是衡量有效训练吞吐占硬件理论峰值算力比例的严苛指标。

与行业基准相比，xAI的表现差距尤为明显。当前，生产级大模型训练的MFU通常维持在35%至45%之间，其中Meta和谷歌凭借长期积累的深厚软件堆栈，其GPU利用率分别可达约43%和46%；

即便在以“低效”著称的GPT-3训练时期，MFU也能稳定在21%-26%之间。反观xAI的11%，不仅远低于当前行业主流水平，甚至不及AI算力发展史上的“古早”尴尬时期。

值得一提的是，坐拥顶级算力却难以发挥价值， xAI 症结不在硬件，而在软件短板。

据悉，xAI一直照搬英伟达标准部署方案，但软件堆栈、并行策略和模型工程优化，远远跟不上硬件激进扩张速度。

具体来看，HBM显存读取速度远慢于计算芯片，导致芯片大量时间空转等待数据；网络拓扑中的任何一处瓶颈，在数万张卡的同步要求下，都会被急剧放大。

此外，Lambda等机构分析指出，显存压力、过度的激活重计算和张量并行带来的跨GPU通信开销等，都是拖累MFU的系统性因素。

值得注意的是，xAI 基建扩张堪称行业奇迹，其Colossus 超算仅 122天建成，GPU规模短时间内极速扩容，过快的硬件铺摊，也放大了软件优化滞后的致命短板。

【本文结束】如需转载请务必注明出处：快科技

责任编辑：秋白

文章内容举报

文章价值打分

当前文章打分0 分，共有0人打分

0
0
0
打赏
|

分享好友:
分享至QQ
分享至微博
分享至QQ空间
|

生成海报

本文收录在

#GPU #xAI #马斯克 #英伟达

好物推荐

换一波

关注我们

微博：快科技官方
快科技官方微博
今日头条：快科技
带来硬件软件、手机数码最快资讯！
抖音：kkjcn
科技快讯、手机开箱、产品体验、应用推荐...

正文内容 评论（0）

相关资讯

文章价值打分

本文收录在

热门文章

换一波

好物推荐

换一波

关注我们

微博：快科技官方

今日头条：快科技

抖音：kkjcn

热点推荐

好物推荐

图片信息

正文内容 评论（0）

相关资讯

文章价值打分

本文收录在

热门文章 换一波

好物推荐 换一波

关注我们

微博：快科技官方

今日头条：快科技

抖音：kkjcn

热点推荐

好物推荐

图片信息

正文内容评论（0）

热门文章

换一波

好物推荐

换一波