经验 4781 分贝 0 家园分 11092 在线时间: 1127 小时 最后登录: 2026-5-28 帖子: 2420 精华: 0 注册时间: 2016-3-7 UID: 1231003
注册:2016-3-7 313
4月15日,英伟达CEO黄仁勋接受播客主持人Dwarkesh Patel的深度访谈,就英伟达如何掌控日益紧张的先进芯片供应链?TPU能否打破英伟达在AI计算领域的垄断地位?为什么英伟达不成为超大规模数据中心运营商?美国是否应该向中国出售 AI 芯片?为什么英伟达不生产多种不同的芯片架构?等热点话题,做了详细的解答。
在谈到中国市场上,黄仁勋指出,中国拥有丰富的能源、大量的芯片以及绝大多数的人工智能研究人员,把中国变成敌人,可能并非最佳方案,开展对话和研究性对话或许是最稳妥的做法。如果建立两个生态系统——一个是只能运行在外国技术栈上的开源生态系统,另一个是运行在美国技术栈上的封闭生态系统——那将是极其愚蠢的。“我认为这对美国来说将是一个糟糕的结果。”
黄仁勋表示,中国的计算能力非常庞大。“如果他们想整合计算资源,完全可以满足需求。黄仁勋讲到了他所提出的AI五层蛋糕的说法,“人工智能的本质就像一个五层蛋糕,最底层是能源。能源充足时,芯片就足够了;芯片充足时,能源就足够了。例如,美国能源匮乏,这就是为什么英伟达必须不断改进我们的架构,并进行这种极致的协同设计。但如果你的瓦数完全充足,而且是免费的,你又何必在意每瓦性能呢?你已经绰绰有余了。你可以用旧芯片来做。所以7nm芯片已经足够好了,充足的能源是中国的优势。”
黄仁勋指出,中国拥有世界上最顶尖的AI研究人员,由于计算能力有限,反而创造出了极其智能的算法。“我们必须承认,人工智能的大部分进步都源于算法的进步,而不仅仅是硬件的改进。既然大部分进步都来自算法、计算机科学和编程,那么他们庞大的人工智能研究人员队伍难道不是他们最根本的优势吗?我们都看到了这一点。DeepSeek 绝非无关紧要的进步。如果DeepSeek先在华为平台上发布,那对我们国家来说将是灾难性的。”
以下为访谈全文:
英伟达最大的护城河是其对稀缺供应链的控制吗?
Q:我们已经看到许多软件公司的估值暴跌,因为人们预期人工智能会使软件商品化。有一种可能过于天真的想法是:你看,英伟达把GDS2文件发给台积电。台积电制造逻辑芯片,制造交换机芯片,然后将它们与SK海力士、美光和三星生产的HBM内存封装在一起。之后,台积电将封装好的芯片发给台湾的ODM厂商,由他们组装成机架。从本质上讲,英伟达制造的是其他人制造的软件,如果软件商品化了,英伟达也会商品化吗?
黄仁勋:最终,总得有某种机制将电子转化为tokens。将电子转化为tokens,并随着时间的推移提升这些tokens的价值,这很难完全商品化。从电子到tokens的转化是一个不可思议的旅程。制造tokens就像让一个分子比另一个分子更有价值,让一个tokens比另一个更有价值。显然,我们正在实时见证着tokens价值的提升,其中蕴含着大量的艺术、工程、科学和发明创造。这种转化、制造以及所有相关的科学原理,我们远未被完全理解,这段旅程也远未结束。我怀疑它最终能否实现。
我们当然会提高效率。你提出的问题正是我对我们公司的理解。输入是电子,输出是tokens。英伟达位于中间。我们的工作是在必要范围内尽可能少地干预,从而以惊人的能力实现这种转型。我所说的“尽可能少地干预”,是指任何我不需要亲自完成的事情,我都会与其他合作伙伴一起,将其纳入我的生态系统。
如果你看看今天的英伟达,我们可能拥有规模最大的合作伙伴生态系统,涵盖供应链的上下游,包括所有计算机公司、应用开发商和模型构建者。人工智能就像一个五层蛋糕,我们的生态系统遍布所有五个层面。我们尽量少做,但事实证明,我们必须做的那部分工作极其困难。我认为这部分工作无法商品化。(We try to do as little as possible, but the part that we have to do, as it turns out, is insanely hard)
事实上,我也不认为企业软件公司、工具制造商……如今大多数软件公司都是工具制造商。当然,也有一些公司不是,它们开发的是工作流程编码系统。但对很多公司来说,它们确实是工具制造商。例如,Excel 是工具,PowerPoint 是工具,Cadence开发工具,Synopsys也开发工具。实际上,我看到的恰恰与人们的看法相反。我认为代理的数量和工具用户的数量都将呈指数级增长。所有这些工具的实例数量很可能会激增。
Synopsys Design Compiler的实例数量很可能会激增,使用平面规划器、布局工具和设计规则检查器的代理数量也会随之大幅增长。如今,我们受限于工程师的数量。未来,这些工程师将得到大量agent的支持。我们将以前所未有的方式探索设计空间,并继续使用我们今天使用的工具。
我认为工具的使用将推动软件公司蓬勃发展。之所以目前还没有出现这种情况,是因为agents还不擅长使用这些工具。要么这些公司会自行开发代理商,要么agents会变得足够熟练,能够使用这些工具。我认为最终会是两者的结合。
Q:在你们最新的文件中,你们与代工厂、内存和封装厂商签订了近1000亿美元的采购承诺。SemiAnalysis报道称,你们这类采购承诺的总额将达到2500亿美元。一种解读是,英伟达的护城河实际上在于你们锁定了未来几年这些稀缺组件的供应。其他厂商或许拥有加速器,但他们真的能获得所需的内存吗?他们真的能获得所需的逻辑芯片吗?这真的是英伟达未来几年最大的护城河吗?
黄仁勋:这是我们能做到而别人很难做到的事情之一。我们在上游投入了大量资源。有些是明确的,比如你提到的这些承诺。有些则是隐性的。例如,我们供应链上的许多上游投资都是由他们进行的,因为我曾对各位CEO说:“让我告诉你们这个行业将会发展到多大的规模,让我解释一下原因,让我和你们一起分析,让我向你们展示我所看到的。”
通过与上游各行各业的CEO们沟通、启发和协调,他们才愿意进行投资。为什么他们愿意为我而不是为其他人投资呢?原因在于,他们知道我有能力购买他们的产品,并通过我的下游渠道销售。事实上,英伟达的下游供应链和我们的下游需求都非常庞大,因此他们愿意进行上游投资。
如果你看看GTC大会,人们都会惊叹于它的规模和参会人员之多。它涵盖了人工智能领域的方方面面,可谓包罗万象。他们齐聚一堂,是因为彼此需要交流。我把他们聚集在一起,是为了让下游企业了解上游,上游企业了解下游,让所有人都能了解人工智能的最新进展。更重要的是,他们还能与人工智能领域的专家、正在蓬勃发展的人工智能初创公司以及所有令人惊叹的成果见面,亲眼见证我所讲述的一切。我花费大量时间,直接或间接地向我们的供应链、合作伙伴和生态系统传达我们面前的机遇。
有些人总是说:“Jensen,大多数主题演讲都是一个接一个的公告。”但我们的主题演讲总会有一部分内容让人感觉有点“折磨”,因为它几乎像是在进行教育。事实上,这正是我所关注的。我需要确保整个供应链,从上到下,整个生态系统,都了解即将发生的事情,它为什么会发生,何时发生,规模有多大,并且能够像我一样系统地思考和分析它。
关于您所描述的护城河,我们有能力为未来做好准备。如果未来几年我们的规模达到万亿美元,我们拥有相应的供应链。如果没有我们的影响力,我们业务的发展速度……就像现金流、供应链和客户流失一样,如果业务流失率很低,没有人会为一个架构构建供应链。我们之所以能够维持如此庞大的规模,完全是因为下游需求巨大。他们看到了这一点,听到了相关信息,预见到了这一切。这使我们能够以如此大的规模去做我们能够做的事情。
Q:我确实想更具体地了解上游能否跟上步伐。多年来,你们的收入每年都翻一番。你们提供给全球的Flops数每年都增长三倍以上。
黄仁勋:现在以这种规模翻倍真的太不可思议了。
Q:没错。但你再看看逻辑。你是台积电N3工艺节点的最大客户,也是N2工艺节点的最大客户之一。今年人工智能整体将占N3工艺节点的60%,根据SemiAnalysis的预测,明年将达到86%。如果你已经占据了大部分市场份额,如何才能实现翻番?又该如何逐年实现这一目标?我们现在是否正处于一个由于上游工艺的限制,人工智能计算增长速度不得不放缓的阶段?你认为有什么办法可以解决这个问题?最终,我们如何才能实现每年两倍的晶圆厂建设量?
黄仁勋:在某种程度上,瞬时需求大于全球上下游的供应。在任何时刻,我们都可能面临plumbers数量不足的限制,而这种情况实际上也时有发生。
Q:plumbers受邀参加明年的GTC大会。
黄仁勋:顺便说一句,这主意不错。但这只是个好条件。你想要的是一个瞬时需求大于行业总供给的行业。反之则显然不好。如果我们之间的距离太远,如果某个特定组件的供应量太少,整个行业就会蜂拥而至。例如,你会发现现在人们很少再谈论CoWoS了。
原因在于,过去两年我们全力以赴,实现了超负荷的产能扩张。我们连续数次加倍,每次都翻倍。现在我认为我们形势相当不错。台积电现在也意识到,CoWoS的供应必须跟上逻辑电路和存储器的需求。他们正以与逻辑电路相同的速度扩展CoWoS和未来的封装技术。这非常棒,因为长期以来,CoWoS和HBM存储器都属于小众技术。但现在它们不再是小众技术了。人们现在意识到它们已经成为主流的计算技术。
当然,我们现在更有能力影响供应链的更大范围。在人工智能革命之初,我五年前就说过现在我说的这些话。有些人相信它并进行了投资,例如Sanjay和美光团队。我仍然清楚地记得那次会议,会上我清楚地阐述了将会发生什么、为什么会发生以及今天的预测。他们确实加倍投入。我们在LPDDR和HBM内存领域与他们展开了合作,他们也确实投入了大量资金。这显然对公司产生了巨大的影响。有些人加入得晚一些,但现在他们都在这里了。
这些瓶颈问题都受到了高度重视。现在,我们正在提前数年预先解决这些瓶颈问题。例如,过去几年我们对Lumentum 、Coherent以及硅光子生态系统的投资,真正重塑了供应链。我们围绕台积电构建了一条完整的供应链。我们与他们合作开发了COUPE 项目,发明了大量技术,并将这些专利授权给供应链,以保持其开放性和高效性。
我们正在通过发明新技术、新工作流程、新型测试设备(例如双面探针测试)来构建供应链,同时投资于相关企业并帮助它们扩大产能。可以看出,我们正努力塑造整个生态系统,使供应链能够支持规模化发展。
Q:似乎有些瓶颈比其他瓶颈更容易解决。例如,扩展 CoWoS 与其他扩展方式相比。
黄仁勋:顺便说一句,我碰到的是难度最高的那一个。
Q:哪个?
黄仁勋:水管工和电工。这就是我对那些描述工作终结和职业消亡的末日论者感到担忧的原因之一。如果我们劝阻人们成为软件工程师,我们就会面临软件工程师短缺的问题。十年前也出现过同样的预测。一些末日论者告诫人们:“无论如何,千万别当放射科医生。”你可能还会在网上看到一些这样的视频,说放射科医生将是第一个消失的职业,世界将不再需要更多的放射科医生。猜猜我们现在缺什么?放射科医生。
Q:回到之前关于有些东西可以规模化生产,而有些东西却不行这一点……你究竟如何才能每年生产两倍的逻辑电路?归根结底,存储器和逻辑电路的瓶颈都在于极紫外光刻(EUV)。你如何才能逐年获得两倍的极紫外光刻设备?
黄仁勋:这些都不是无法快速扩展的。所有这些都可以在两三年内轻松实现。你只需要一个需求信号。一旦你能造出一个,你就能造出十个;一旦你能造出十个,你就能造出一百万个。这些都不难复制。
Q:你会追溯到供应链的哪个环节?你会去找ASML说:“嘿,如果我展望三年后,英伟达的年收入达到两万亿美元,我们需要更多的EUV光刻机”吗?
黄仁勋:有些我必须直接说服,有些需要间接,还有一些……如果我能说服台积电,ASML也会被说服。我们必须考虑关键的瓶颈。但如果台积电被说服了,几年后你们就会有很多EUV光刻机可用了。
我的意思是,所有瓶颈都不会持续超过两三年,一个都不会。与此同时,我们的计算效率提高了10倍、20倍,以Hopper到Blackwell为例,甚至提高了30倍到50倍。由于CUDA的灵活性,我们不断开发新的算法。我们正在开发各种新技术,以提高效率,同时提升产能。这些我都不担心。真正让我担忧的是下游的问题。那些阻碍能源发展的能源政策……没有能源,就无法建立任何产业。没有能源,就无法建立一个全新的制造业。
我们希望重振美国工业。我们希望恢复芯片制造、计算机制造和封装产业。我们希望研发电动汽车和机器人等新产品。我们希望建设人工智能工厂。所有这些都离不开能源,而且这些项目都需要很长时间。增加芯片产能,这需要两到三年的时间。增加CoWoS产能,也需要两到三年的时间。
Q:有意思。我感觉有时候客人会跟我说完全相反的话。这种情况下,我确实缺乏相关的专业知识来判断。
黄仁勋:最妙的是,你是在和专家对话。
TPU能否打破英伟达在 AI 计算领域的垄断地位?
Q:我想问问你们的竞争对手。如果你看看TPU ,可以说全球排名前三的模型中,有两款——Claude和Gemini——都是用TPU训练的。这对英伟达未来的发展意味着什么?
黄仁勋:我们打造的是截然不同的东西。英伟达打造的是加速计算,而不是张量处理单元。加速计算的应用范围非常广泛:分子动力学、量子色动力学、数据处理、数据帧、结构化数据和非结构化数据。它也用于流体动力学和粒子物理学。此外,我们还将其应用于人工智能领域。
加速计算的范畴远比这广泛得多。虽然人工智能是当今的热门话题,而且显然非常重要且影响深远,但计算的范畴远不止于此。英伟达彻底革新了计算方式,从通用计算转向加速计算。我们的市场覆盖范围远远超过任何TPU或ASIC芯片所能企及的范围。从我们的市场地位来看,我们是唯一一家能够加速所有类型应用程序的公司。我们拥有庞大的生态系统。因此,各种框架和算法都可以在英伟达平台上运行。
因为我们的计算机设计之初就考虑到了由他人操作,所以任何具备操作能力的人都可以购买我们的系统。而大多数自建系统则需要用户自行操作,因为它们的设计初衷并非为了方便他人操作。由于任何人都可以操作我们的系统,因此我们的产品已部署在包括 Google、Amazon、Azure 和 OCI 在内的所有云平台上。
如果您想以租赁方式运营,最好拥有一个涵盖多个行业的庞大客户生态系统,以便他们成为承购方。如果您想自行运营,我们当然有能力帮助您,就像我们之前为埃隆·马斯克提供的 xAI 服务一样。而且,由于我们能够赋能任何公司和任何行业的运营者,您可以利用这项技术为礼来公司构建一台用于科学研究和药物研发的超级计算机。我们可以帮助他们运营自己的超级计算机,并将其用于我们所加速的各个药物研发和生物科学领域。
我们能够解决很多TPU无法解决的应用问题。英伟达打造CUDA的目的不仅在于使其成为一个出色的张量处理单元,它还能处理数据处理、计算、人工智能等各个生命周期。我们的市场机会更大,覆盖范围也更广。因为我们现在支持全球所有应用,所以无论你在哪里构建英伟达系统,都无需担心找不到客户。这完全是两码事。
Q:这将是一个很长的问题。你们的营收非常惊人,但你们每季度600亿美元的收入并非来自制药和量子计算领域。你们之所以能做到这一点,是因为人工智能是一项前所未有的技术,而且它正以前所未有的速度发展。
那么问题就变成了:哪种方案最适合人工智能?我不太了解细节,但我跟我的人工智能研究朋友聊过,他们说:“你看,我用TPU的时候,它是一个大型的脉动阵列,非常适合做矩阵乘法,而GPU则非常灵活。当你需要处理大量分支或不规则的内存访问时,它就非常棒。”
但人工智能究竟是什么?它不过是不断重复进行这些非常可预测的矩阵乘法运算。你无需为线程束调度器或线程与内存库之间的切换而牺牲任何芯片面积。而且,TPU 针对当前计算领域收入增长和应用场景的大量需求进行了优化。我想知道你对此有何看法。
黄仁勋:矩阵乘法是人工智能的重要组成部分,但并非全部。如果你想提出新的注意力机制、以不同的方式进行分解,或者发明一种全新的架构——例如混合SSM——你需要一个通用的可编程架构。如果你想创建一个融合扩散和自回归技术的模型,你同样需要一个通用的可编程架构。我们几乎可以运行你所能想象的一切。这就是它的优势所在。由于它是一个可编程系统,因此可以更轻松地发明新的算法。
人工智能之所以能如此快速发展,真正的原因在于其不断发明新算法的能力。与其他任何事物一样,TPU(技术处理单元)也受到摩尔定律的影响,而摩尔定律的年增长率约为25%。要想真正实现10倍甚至100倍的飞跃,唯一的办法就是每年从根本上改变算法及其计算方式。
这就是英伟达的根本优势。我们之所以能让 Blackwell 的能效比 Hopper 高出 50 倍,唯一的原因是……当初我宣布 Blackwell 的能效将比 Hopper 高出 35 倍时,没人相信。后来Dylan写了篇文章说我故意隐瞒,但实际上能效是 Hopper 的 50 倍。单凭摩尔定律是无法实现这一点的。我们解决这个问题的方法是采用新的模型,例如MoE(模块化执行单元),这些模型可以并行化、解耦并分布在整个计算系统中。如果没有能力真正深入研究并利用 CUDA 开发新的内核,这一切都很难做到。
这得益于我们架构的可编程性,以及英伟达作为一家极致的协同设计公司的优势。我们甚至可以将部分计算任务卸载到架构本身(例如NVLink )或网络(例如Spectrum-X)中。我们可以同时对处理器、系统、架构、库和算法进行更改。如果没有 CUDA,我真不知道该从何入手。
Q:这引出了一个关于英伟达客户群的有趣问题。你们60%的收入都来自五大超大规模数据中心运营商。如果换个时代,面对不同的客户群体——比如说进行实验的教授——他们需要CUDA。他们无法使用其他加速器。他们只需要用CUDA运行PyTorch ,并且所有功能都得到优化。
但这些超大规模数据中心运营商拥有编写自有内核的资源。事实上,为了获得其特定架构所需的最后 5% 的性能提升,他们必须这样做。Anthropic 和 Google 大多运行着自己的加速器,或者使用 TPU 和Trainium 。即使是使用 GPU 的 OpenAI,也使用Triton ,因为他们需要自己的内核。甚至在 CUDA C++ 方面,他们也没有使用cuBLAS和NCCL ,而是拥有自己的技术栈,该技术栈还可以编译到其他加速器上。如果你的大多数客户能够并且确实找到了 CUDA 的替代方案,那么 CUDA 在多大程度上真的能够推动 Nvidia 平台上的前沿 AI 应用?
黄仁勋:CUDA 拥有丰富的生态系统。如果您想先在任何计算机上进行构建,那么首先基于 CUDA 进行构建是非常明智的选择。正因为其生态系统如此丰富,我们才能支持所有框架。如果您想创建自定义内核……例如,我们为 Triton 做出了巨大贡献。因此,Triton 的后端使用了大量的 Nvidia 技术。
我们很高兴能够帮助每个框架发挥其最大潜力。框架种类繁多,例如Triton、vLLM 、SGLang等等。现在又涌现出许多新的强化学习框架,例如verl和NeMo RL 。随着训练后处理和强化学习的不断发展,整个领域正经历着爆炸式增长。因此,如果您想基于某个架构进行开发,那么基于 CUDA 无疑是最佳选择,因为 CUDA 的生态系统非常完善。
你知道,如果出了问题,更有可能出在你的代码里,而不是底层那堆积如山的代码里。构建这些系统时,别忘了你要处理的代码量有多大。如果出了问题,是你的问题还是电脑的问题?你肯定希望问题总是出在你身上,并且能够信任电脑。当然,我们自己也存在很多 bug,但我们的系统已经过充分测试,至少你可以在这个基础上继续开发。这就是第一点:生态系统的丰富性、可编程性和强大功能。
第二点是,如果你是一名开发者,无论开发什么软件,你最看重的就是用户基数。你希望你编写的软件能够在大量的其他计算机上运行。你开发软件并非仅仅为了自己,而是为了你的服务器群,或者其他所有人的服务器群,因为你是一名框架构建者。英伟达的 CUDA 生态系统最终是其最大的财富。
现在市面上已经有数亿个GPU。每个云平台都配备了GPU。从A10 、A100 、H100 、H200 ,到L系列、P系列等等,种类繁多,尺寸和形状也各不相同。如果你是一家机器人公司,你肯定希望CUDA协议栈能够直接在机器人上运行。我们的产品几乎无处不在。庞大的用户群意味着,一旦你开发出软件或模型,它就能在任何地方使用。这简直太有价值了。
最后,我们能够覆盖所有云平台,这使我们真正独树一帜。如果您是一家人工智能公司或开发者,您可能并不确定应该与哪家云服务提供商合作,或者在哪里运行。我们几乎可以在任何地方运行,如果您愿意,我们也可以为您提供本地部署服务。丰富的生态系统、庞大的用户群以及我们灵活的部署方式,共同造就了 CUDA 的无可比拟的价值。
Q:这很有道理。我好奇的是,这些优势对你的主要客户来说是否重要。对很多人来说,这些优势可能很重要。能够构建自己软件栈的那类人贡献了你的大部分收入。尤其是在人工智能越来越擅长那些具有严格验证循环、可以进行强化学习的领域……如何编写一个内核,使其在规模化应用中能够最高效地处理注意力机制或多层感知器(MLP)?这是一个非常容易验证的反馈循环。
所有超大规模数据中心运营商都能自行编写这些定制内核吗?英伟达的性价比依然很高,所以他们可能仍然更倾向于使用英伟达的产品。但问题在于,最终会不会演变成谁能以最低的价格提供最佳的规格、浮点运算能力和内存带宽?历史上,英伟达凭借CUDA的护城河,在人工智能领域(包括硬件和软件)一直保持着最高的利润率,高达70%。而问题是,如果大多数客户能够负担得起自行构建,而不是依赖CUDA的护城河,英伟达还能维持这样的利润率吗?
黄仁勋:我们为这些人工智能实验室配备了数量惊人的工程师,他们与这些实验室合作,优化他们的技术栈。原因在于,没有人比我们更了解我们的架构。这些架构不像CPU那样通用。CPU有点像凯迪拉克,它是一款舒适的巡航车,速度不会太快,每个人都能轻松驾驭。它配备了巡航控制,一切都很简单。但在很多方面,英伟达的GPU和加速器就像F1赛车。我估计每个人都能以每小时一百英里的速度驾驶它,但要将其性能发挥到极致,则需要相当丰富的专业知识。我们运用了大量的人工智能技术来创建我们的内核。
我非常肯定,在相当长的一段时间内,我们仍然会被需要。我们的专业知识通常能帮助我们的人工智能实验室合作伙伴轻松地将他们的技术栈性能提升两倍。我们完成技术栈优化或特定内核优化后,他们的模型速度提升三倍、两倍甚至五成的情况并不少见。这是一个巨大的数字,尤其考虑到他们庞大的设备基数,包括他们所有的 Hopper 和 Blackwell 等计算单元。性能提升一倍,收入也会翻倍。这直接转化为实际收益。
英伟达的计算堆栈是全球性价比最高的,没有之一。目前世界上没有任何一个平台能证明它的性能/总拥有成本比更高。没有一家公司能做到。事实上,现有的基准测试,比如Dylan的InferenceMAX ,人人都能用,但没有任何一家公司能做到……TPU不会推出,Trainium也不会推出。
我鼓励他们使用 InferenceMAX 来展示他们惊人的推理成本。这真的很难。没人愿意来。MLPerf 。我倒是很想听听 Trainium 展示一下他们一直声称的 40% 的成本优势。我很想听听他们如何证明 TPU 的成本优势。在我看来,这完全说不通。一点道理都没有。从根本上来说,这根本说不通。
所以我认为我们如此成功的原因很简单,就是我们的总体拥有成本 (TCO) 非常低。其次,您提到我们 60% 的客户是前五大企业,但其中大部分业务都是外部业务。例如,AWS 上的英伟达产品大部分是为外部客户而非内部用户提供的。Azure 上的所有客户也都是外部客户。OCI 上的所有客户也都是外部客户,而非内部用户。他们之所以青睐我们,是因为我们的覆盖范围非常广。我们可以为他们带来全球所有优秀的客户。这些客户都基于英伟达的产品。而所有这些公司之所以都基于英伟达的产品,正是因为我们覆盖范围广、功能多样。
所以我认为真正的飞轮效应在于用户基数、我们架构的可编程性、我们生态系统的丰富性,以及全球人工智能公司数量众多这一事实。现在有成千上万家人工智能公司。如果你是其中一家人工智能初创公司,你会选择哪种架构?你会选择最普及的架构。而我们的架构是全球最普及的。你会选择用户基数最大的架构。而我们的用户基数最大。你还会选择拥有丰富生态系统的架构。
这就是飞轮效应。原因在于:首先,我们的每美元性能如此之高,以至于他们的tokens成本最低。其次,我们的每瓦性能是全球最高的。因此,如果我们的合作伙伴建造了一个1吉瓦的数据中心,那么这个1吉瓦的数据中心必须能够产生最大的收益和tokens数量,这直接转化为收入。您希望它产生尽可能多的代币,从而最大化数据中心的收益。我们拥有全球最高的每瓦代币产量架构。最后,如果您的目标是租用基础设施,我们拥有全球最多的客户。这就是飞轮效应发挥作用的原因。
Q:有意思。我想问题的关键在于,实际的市场结构究竟如何?因为即便还有其他公司……原本可能存在成千上万家人工智能公司,它们大致平分计算资源。但即便通过这五家超大规模数据中心,真正使用亚马逊计算资源的仍然是 Anthropologie、OpenAI 以及那些有能力且能够自行部署不同加速器的大型基金会实验室。
黄仁勋:不,我认为你的前提是错误的。
Q:也许吧。不过,我想问你一个稍微不同的问题。如果价格、性能、每瓦性能等等这些说法都是真的,那么你认为为什么像 Anthropic 这样的公司会在几天前宣布他们与 Broadcom 和 Google 达成了一项数吉瓦的 TPU 协议,用于他们的大部分计算呢?
显然,对谷歌来说,TPU占据了大部分计算资源。所以,如果我观察这些大型人工智能公司,会发现它们的很多计算资源……曾经有一段时间它们都依赖英伟达的加速器,但现在情况并非如此。因此,我很好奇,如果这些说法在理论上成立,它们为什么会选择其他加速器呢?
黄仁勋:Anthropic 是一个特例,而非一种趋势。如果没有 Anthropic,TPU 又怎会增长?它完全是 Anthropic 的功劳。如果没有 Anthropic,Trainium 又怎会增长?它也完全是 Anthropic 的功劳。我认为这一点已广为人知。ASIC 的机会并不多,Anthropic 只有一个。