老黄赢麻了英伟达H100订单排到24年--快科技--科技改变未来

正文内容 评论（0）

老黄赢麻了英伟达H100订单排到24年

2023-08-12 12:28:32 出处：量子位作者：梦晨克雷西编辑：随心评论(0)

#英伟达 #黄仁勋

炼大模型最佳GPU英伟达H100，全部卖空了！

即使现在立即订购，也要等2024年Q1甚至Q2才能用上。

这是与英伟达关系密切的云厂商CoreWeave对华尔街日报透露的最新消息。

从4月初开始，供应就变得异常紧张。仅仅一周之内，预期交货时间就从合理水平跳到了年底。

全球最大云厂商亚马逊AWS也证实了这一消息，CEO Adam Selipsky近期表示：

A100和H100是最先进的……即使对于AWS来说也很难获得。

更早时候，马斯克还在一场访谈节目中也说过：GPU现在比d品还难获得。

如果找“黄牛”买，溢价高达25%。

如Ebay上的价格已从出厂价约36000美元涨到了45000美元，而且货源稀少。

这种形势下，国内的百度、字节、阿里、腾讯等大型科技公司也向英伟达下了总计50亿美元的A800等芯片订单。

其中只有10亿美元的货能今年内交付，另外80%也要等2024年才行。

那么现有高端GPU都卖给谁了？这一波产能又是卡在了哪？

H100卖给谁，老黄说了算

ChatGPT爆发以来，擅长训练大模型的英伟达A100、H100成了香饽饽。

甚至H100已经可以作为初创公司的一种资产，找投资基金获得抵押贷款。

OpenAI、Meta为代表的AI公司，亚马逊、微软为代表的云计算公司，私有云Coreweave和Lambda，以及所有想炼自家大模型的各类科技公司，需求量都巨大。

然而卖给谁，基本是英伟达CEO黄仁勋说了算。

老黄赢麻了英伟达H100订单排到24年

据The Information消息，H100这么紧缺，英伟达把大量的新卡分配给了CoreWeave，对亚马逊微软等老牌云计算公司限量供应。

（英伟达还直接投资了CoreWeave。）

外界分析是因为这些老牌公司都在开发自己的AI加速芯片、希望减少对英伟达的依赖，那老黄也就成全他们。

老黄在英伟达内部还把控了公司日常运营的方方面面，甚至包括“审查销售代表准备对小型潜在客户说什么话”。

全公司约40名高管直接向老黄汇报，这比Meta小扎和微软小纳的直接下属加起来还多。

一位英伟达前经理透露，“在英伟达，黄仁勋实际上是每一款产品的首席产品官。”

前阵子，还传出老黄干了一件夸张的事：要求一些小型云计算公司提供他们的客户名单，想了解GPU的最终使用者是谁。

外界分析，此举将使英伟达更了解客户对其产品的需求，也引起了对英伟达可能利用这些信息谋取额外利益的担忧。

也有人认为，还有一层原因是老黄想知道谁真的在用卡，而谁只是囤卡不用。

老黄赢麻了英伟达H100订单排到24年

为什么英伟达和老黄现在有这么大的话语权？

主要是高端GPU供需太不平衡，根据GPU Utils网站的测算，H100缺口高达43万张。

作者Clay Pascal根据各种已知信息和传言估计了AI行业各参与者近期还需要的H100数量。

AI公司方面：

OpenAI可能需要5万张H100来训练GPT-5

Meta据说需要10万

InflectionAI的2.2万张卡算力集群计划已公布

主要AI初创公司如Anthropic、Character.ai、欧洲的MistraAI和HelsingAI需求各自在1万数量级。

云计算公司方面：

大型公有云里，亚马逊、微软、谷歌、甲骨文都按3万算，共12万

以CoreWeave和Lambda为代表的私有云加起来总共需要10万

加起来就是43.2万了。

这还没算一些摩根大通、Two Sigma等也开始部署自己算力集群的金融公司和其他行业参与者。

那么问题来了，这么大的供应缺口，就不能多生产点吗？

老黄也想啊，但是产能被卡住了。

产能这次卡在哪里？

其实，台积电已经为英伟达调整过一次生产计划了。

不过还是没能填补上如此巨大的缺口。

英伟达DGX系统副总裁兼总经理Charlie Boyle称，这次并不是卡在晶圆，而是台积电的CoWoS封装技术产能遇到了瓶颈。

与英伟达抢台积电产能的正是苹果，要在9月发布会之前搞定下一代iPhone要用的A17芯片。

而台积电方面近期表示，预计需要1.5年才能使封装工艺积压恢复正常。

CoWoS封装技术是台积电的看家本领，台积电之所以能击败三星成为苹果的独家芯片代工厂靠的就是它。

这项技术封装出的产品性能高、可靠性强，H100能拥有3TB/s(甚至更高)的带宽正是得益于此。

CoWoS全名叫Chip-on-Wafer-on-Substrate，是一种在晶圆层面上的芯片集成技术。

这项技术可以将多个芯片封装到厚度仅有100μm的硅中介层上。

据介绍，下一代中介层面积将达到6倍reticle，也就是约5000mm?。

目前为止，除了台积电，没有哪家厂商拥有这个水平的封装能力。

虽然CoWoS的确强悍，但没有它就不行吗？其他厂商能不能代工呢？

先不说老黄已经表示过“不考虑新增第二家H100代工厂”。

从现实上看，可能也真的不行。

英伟达此前曾和三星有过合作，但后者从未给英伟达生产过H100系列产品，甚至其他5nm制程的芯片。

据此有人推测，三星的技术水平可能无法满足英伟达对尖端GPU的工艺需求。

至于英特尔……他们的5nm产品好像还迟迟没有问世。

老黄赢麻了英伟达H100订单排到24年

既然让老黄换生产厂家行不通，那用户直接改用AMD怎么样？

AMD，Yes？

如果单论性能的话，AMD倒的确是慢慢追上来了。

AMD最新推出的MI300X，拥有192GB的HBM3内存、5.2TB/s的带宽，可运行800亿参数模型。

而英伟达刚刚发布的DGX GH200，内存为141GB的HBM3e，带宽则为5TB/s。

但这并不意味着AMD能马上填补N卡的空缺——

英伟达真正的“护城河”，在于CUDA平台。

CUDA已经建立起一套完整的开发生态，意味着用户要是购买AMD产品，需要更长时间来进行调试。

一名某私有云公司的高管表示，没人敢冒险花3亿美元实验部署10000个AMD GPU。

这名高管认为，开发调试的周期可能至少需要两个月。

在AI产品飞速更新换代的大背景下，两个月的空档期对任何一家厂商来说可能都是致命的。

老黄赢麻了英伟达H100订单排到24年

不过微软倒是向AMD伸出了橄榄枝。

此前有传闻称，微软准备和AMD共同开发代号为“雅典娜”的AI芯片。

而更早之前，MI200发布时，微软第一个宣布采购，并在其云平台Azure上部署。

比如前一阵MSRA的新大模型基础架构RetNet就是在512张AMD MI200上训练的。

在英伟达占据几乎整个AI市场的格局下，可能需要有人带头冲锋，先整个大型AMD算力集群打样，才有人敢于跟进。

不过短时间内，英伟达H100、A100还是最主流的选择。

One More Thing

前一阵苹果发布最高支持192GB内存新款M2 Ultra芯片的时候，还有不少从业者畅享过用它来微调大模型。

毕竟苹果M系列芯片的内存显存是统一的，192GB内存就是192GB显存，可是80GB H100的2.4倍，又或者24GB RTX4090的8倍。

然鹅，有人真的把这台机器买到手后，实际测试训练速度还不如英伟达RTX3080TI，微调都不划算，训练就更别想了。

毕竟M系列芯片的算力部分不是专门针对AI计算优化的，光大显存也没用。

炼大模型，看来主要还是得靠H100，而H100又求之不得。

面对这种情况，网络上甚至流传着一首魔性的“GPU之歌”。

很洗脑，慎入。

责任编辑：随心

文章价值打分

当前文章打分0 分，共有0人打分

0
0
0
打赏
|

分享好友:
分享至QQ
分享至微博
分享至QQ空间
|

生成海报

本文收录在

#英伟达 #黄仁勋 #显卡

好物推荐

换一波

关注我们

微博：快科技官方
快科技官方微博
今日头条：快科技
带来硬件软件、手机数码最快资讯！
抖音：kkjcn
科技快讯、手机开箱、产品体验、应用推荐...

正文内容 评论（0）

相关资讯

文章价值打分

本文收录在

热门文章

换一波

好物推荐

换一波

关注我们

微博：快科技官方

今日头条：快科技

抖音：kkjcn

热点推荐

好物推荐

图片信息

正文内容 评论（0）

相关资讯

文章价值打分

本文收录在

热门文章 换一波

好物推荐 换一波

关注我们

微博：快科技官方

今日头条：快科技

抖音：kkjcn

热点推荐

好物推荐

图片信息

正文内容评论（0）

热门文章

换一波

好物推荐

换一波