OpenAI牵头：AMD、NVIDIA、Intel、微软、博通巨头罕见联手！终于把AI网络层搞定--快科技--科技改变未来

正文内容 评论（0）

OpenAI牵头：AMD、NVIDIA、Intel、微软、博通巨头罕见联手！终于把AI网络层搞定

2026-05-07 11:17:23 出处：快科技作者：黑白编辑：黑白评论(0)

复制

纠错

#OpenAI #NVIDIA

快科技5月7日消息，OpenAI今日通过开放计算项目（OCP）正式发布MRC（多路径可靠连接）协议，解决大规模AI训练中的GPU网络通信瓶颈。

该协议由OpenAI与AMD、NVIDIA、Intel、微软和博通历时两年联合开发，目前已在搭载NVIDIA GB200的超算集群中投入实际使用。

MRC要解决的核心问题是：在训练大规模AI模型时，单次数据传输延迟就足以导致整个训练过程中断，GPU集体空转等待，而集群规模越大，由网络拥塞、链路和设备故障引发的延迟问题越频繁。

MRC的方案是将单条800Gb/s网络接口拆分为多条更小的链路，例如将一个接口连接至8台不同交换机，构建8条独立的100Gb/s并行网络，而非依赖单一800Gb/s网络。

这一改变对集群拓扑结构的影响极为明显，一台支持64个800 Gb/s端口的交换机，在拆分后可连接512个100 Gb/s端口，使得仅用两层交换机即可实现约13.1万块GPU的全互联网络。

传统800 Gb/s方案则需要三到四层交换机才能达到同等规模，层数减少直接意味着延迟降低和故障点减少。

MRC基于现有的RDMA over RoCE（融合以太网）协议扩展，支持GPU和CPU的硬件加速远程直接内存访问。

OpenAI已在Oracle Cloud Infrastructure和微软Fairwater超算上的GB200集群中部署MRC，用于训练前沿模型。

该协议也将成为OpenAI正在建设的Stargate超算的基础网络架构，该超算目标在2029年部署10GW AI算力，过去三个月已部署超过3GW。

MRC协议还向整个AI行业开放，OpenAI表示希望借此推动跨行业协作，共同解决AI基础设施中最棘手的网络难题。

【本文结束】如需转载请务必注明出处：快科技

责任编辑：黑白

文章内容举报

文章价值打分

当前文章打分0 分，共有0人打分

0
0
0
打赏
|

分享好友:
分享至QQ
分享至微博
分享至QQ空间
|

生成海报

本文收录在

#OpenAI #NVIDIA #GPU

好物推荐

换一波

关注我们

微博：快科技官方
快科技官方微博
今日头条：快科技
带来硬件软件、手机数码最快资讯！
抖音：kkjcn
科技快讯、手机开箱、产品体验、应用推荐...

正文内容 评论（0）

相关资讯

文章价值打分

本文收录在

热门文章

换一波

好物推荐

换一波

关注我们

微博：快科技官方

今日头条：快科技

抖音：kkjcn

热点推荐

好物推荐

图片信息

正文内容 评论（0）

相关资讯

文章价值打分

本文收录在

热门文章 换一波

好物推荐 换一波

关注我们

微博：快科技官方

今日头条：快科技

抖音：kkjcn

热点推荐

好物推荐

图片信息

正文内容评论（0）

热门文章

换一波

好物推荐

换一波