正文内容 评论(0

OpenAI研发高效推理方案:模型运行成本降低50%
2026-07-01 00:26:55  出处:快科技 作者:鹿角 编辑:鹿角     评论(0)点击可以复制本篇文章的标题和链接复制对文章内容进行纠错纠错

快科技7月1日消息,据The Information,知情人士透露,OpenAI工程师本月早些时候向团队内部表示,依托多项全新研发的优化技术,已成功找到一套可将模型推理成本削减一半以上的方案。

在将该技术应用于无免费或付费账户的访客ChatGPT使用场景后,所需英伟达GPU数量一度被压缩至仅数百个,效率提升显著。

此前有消息称,OpenAI与博通联合研发的ASIC芯片项目——代号“墨西哥胡椒”。

该芯片完全针对大模型推理从零开始设计,当专用芯片摆脱通用GPU架构的束缚后,硬件突破带来的不再是温和升级,而是实质性的重构,推理成本最高可直接降低一半。

随着头部AI厂商掌握自主算力源头,对英伟达GPU的依赖逐步减少,通用硬件的产能与定价权将不再构成制约,也意味着整个AI生态话语权正在发生转移。

OpenAI研发高效推理方案:模型运行成本降低50%

【本文结束】如需转载请务必注明出处:快科技

责任编辑:鹿角

文章内容举报

  • 支持打赏
  • 支持0

  • 反对

  • 打赏

文章价值打分

当前文章打分0 分,共有0人打分
  • 分享好友:
  • |
本文收录在
#OpenAI#成本#推理

  • 热门文章
  • 换一波

  • 好物推荐
  • 换一波

  • 关注我们

  • 微博

    微博:快科技官方

    快科技官方微博
  • 今日头条

    今日头条:快科技

    带来硬件软件、手机数码最快资讯!
  • 抖音

    抖音:kkjcn

    科技快讯、手机开箱、产品体验、应用推荐...