猫叔 傅里叶的猫
关于H200的放开问题,前段时间就已经在讨论了,当时也写了一篇分析:英伟达H200如果放开,中国会接受吗?这篇文章,以NV服务器分销商的身份,再来理性分析一下。
1、美国放开的原因大家都知道,老黄一直在努力劝说美国政府,放开H200,主要原因是清库存。
英伟达H200库存主要集中在NV和代工模组厂商,而上游台系ODM厂库存极低,且因超微被美国商务部调查导致供货受限,整体供应链提货能力不足。老黄急于清理库存,而美国那边,现在市场上的主流产品已经是B系列了,无论是GB200,还是8卡机B200/B300,想靠美国市场消化掉这些H200是比较难的,还是要靠中国市场。
我们前段时间一直在提美国缺电的问题,这是目前美国数据中心最大的问题。美国数据中心仍在扩建,但电力供应紧张,Blackwell架构相比H100/H200更省电并支持液冷,能效比更高,未来H100/H200将逐步下架。这些旧型号设备若无法在美国内部消化,最理想的处理方式依然是合法卖给中国,实现库存转移。
2、中国的态度其实就H200放开的这个消息,网上大家的看法有明显的两级分化的现象。
一方面认为国产AI芯片性能目前还达不到H200的水平,大厂们是需要H200的,所以我们会放开;另一方面认为美国说放开我们也同意,就等于自废武功,不利于国产芯片的发展,而且也是给了美国卡脖子的机会,谁也没法保证后面美国会不会再禁运了。 从经济性的角度来讲,我们这边没有禁掉的理由。
1 H200的单卡的性能(主要是算力和显存带宽),目前来看,是要高于国内的AI卡的
2 无论是海外还是国内,很多的旧代码都是基于Hopper的,H200进来后,基本可以即插即用,这些大厂们最喜欢的一点。
3 即便之前H200是禁运的,但其实国内H200的情况大家也都听过,这些就不展开说了。目前海关只是对H20这些阉割版查的是比较严的。所以美国放开后,我们这边再禁掉,似乎有点不太合理。
4 根据Bernstein的分析,明年国产GPU的产能并不会大幅提升,到了2027年的提升才会比较大,说明目前我们对高端的AI卡还是比较缺的。
但领导层肯定不只从经济角度考虑,更多是还是zz角度,是否允许H200进口取决于中美关系走向,若双方寻求缓和,则放行可能性高;若继续博弈,则可能拒绝以示强硬,领导层需在经济发展与科技自主之间做出权衡。
3、对国产市场的影响1 H200对中国客户具有实际应用价值,目前国内的CSP们基本都是用于训练,因为用H200做推理的话,性价比不高。而国产AI芯片,目前大部分都是用于推理的场景。在推理中,国产GPU厂可以把算子写好,然后CSP客户直接调用这些写好的算子就可以了,省时又省力;但训练的话,算子都需要客户自己去写,这时对国产GPU的底层硬件和软件易用性的要求就比较高了。还有一点就是推理的话,假设2个卡做一个推理任务,那这两个卡跟其他卡之间的任务就没有必然联系,训练则需要集群中所有的卡配合完成,对集群互联、稳定性的要求是比较高的。
解释了这么多,结论就是目前H200不直接跟国产GPU卡竞争,对国内GPU卡的影响不会很大。
2 由于内存价格翻倍上涨,即便H200模组降价1万美元,总体成本节省有限,经济性并不会显著提升。
3 对于那几个资本开支比较大的CSP来说,他们上半年针对B系列的采购其实并不是非常多,国内B系列的保有量也不是很多,很多都在等B300,性能相比H200提升很多。
市场上关于H200放开的消息引发情绪波动,讨论也非常激烈,但实际影响有限。真正决定走势的是政策取向、市场需求与资金状况,而非单纯的技术可用性。
|