通信人家园

 找回密码
 注册

只需一步,快速开始

短信验证,便捷登录

搜索

军衔等级:

  少校

注册:2010-4-2811
跳转到指定楼层
1#
发表于 2025-5-21 19:01:49 |只看该作者 |倒序浏览

2022 年,黄仁勋曾致力于让世界认识到 GPU 计算的潜力。如今,随着这一目标逐步实现,英伟达开始面临诸如芯片管制政策、市场业务拓展、技术与行业发展等一系列新的问题。

4 年前,英伟达在中国拥有 95% 的市场份额。今天,只剩下了 50%,”在不久前召开的 Computex 2025 上,黄仁勋如是抱怨道,“其余份额都被中国技术(公司)抢占。如果没有英伟达,他们也会使用很多本地技术。”

在结束 Computex 2025 的个人主题演讲后,黄仁勋在与国外科技博客 Stratechery 的对话中,再次表达了这一立场。他认为,把全球 AI 的发展变成一场围堵游戏,“只会促使对方更加伟大。”

任何认为通过禁止中国使用 H20 芯片,就能切断中国发展 AI 能力的人,都是极其无知的。”黄仁勋担心,美国的芯片扩散规则会使中国构建非美国的 AI 生态系统,威胁英伟达 CUDA 的地位。



此次访谈围绕一系列热门话题展开,包括芯片扩散规则、英伟达和中国、AI GDP 增长,以及阿拉伯 AI、企业 AI 和游戏等。

学术头条在不改变原文大意的情况下,对「英伟达和中国」、「AI GDP 增长」、「Dynamo 与全栈英伟达」三部分内容做了精编。如下:

“要想赢,不该靠拉别人下马”

美国对中国的芯片限制政策引发了黄仁勋的思考。他提到,限制英伟达进入中国市场可能对美国自身不利,因为这可能促使中国发展替代技术。

如果我们不在中国参与竞争,而让中国的生态系统自行发展,它就会形成一个丰富的生态系统。当世界正在广泛传播 AI 技时,新的平台会被开发出来,而这些平台不来自美国,那么他们的领导地位和技术就会在全球范围内扩散。”

作为一家美国科技巨头的掌门人,黄仁勋并不回避爱国主义情怀,“我们当然希望美国赢,每个公司都希望自己的国家赢。”他随即补充道:“我认为,要想赢,不该靠拉别人下马,而是靠自己跑得更快。”在他看来,把全球 AI 的发展变成一场围堵游戏,“只会促使对方更加伟大。”

他反感要通过打压对方来获胜的零和逻辑,“这对我来说毫无意义。我们取得今天的地位,靠的是自身努力,而不是靠外界支持。”他表示,竞争和渴望伟大是一件好事,无论来自哪一个国家,“中国渴望成为强国,这本身就是一件值得尊重的事。”

尽管有人认为,美国对华出口管制还远未“彻底切断”,黄仁勋却直言:“你说这是‘做到一半’,但我认为‘不进入中国’这件事,其实已经完成了 90%。”

他表示,政策的变化给市场运营带来了残酷的代价。“我们已经写下了55 亿美元的库存损失,此外我们还主动放弃了150 亿美元销售额,以及大约30 亿美元的税收。”

更令他担忧的是,在退出中国市场后,英伟达苦心建立的 AI 生态系统——特别是 CUDA 平台正面临系统性威胁,中国可能会构建一个替代品。“任何认为通过禁止中国使用 H20 芯片,就能切断中国发展 AI 能力的人,都是极其无知的。”

具身机器人将扩大全球 GDP

黄仁勋将英伟达定义为「基础设施企业」:“如果你像往常一样,持续关注我的主题演讲,就会发现如今正在发生的事,我在 5 年前就已谈及。尽管 5 年前讲述时,用词没那么清晰准确,但发展方向始终如一。”

正因如此,他自信满满地说:“我谈论机器人已经 3 年了,我们在几年后就会看到它真正落地。”

真正让他觉得意义重大的是,一直身处的“信息技术(IT)”行业,即将跨越传统 IT 预算边界,“我们过去 60 年一直在 IT 预算里运作,但随着 AI 的到来,我们要进入制造业预算,甚至进入运营支出预算”,这意味着从 1 万亿美元级别的 IT 市场,迈向 50 万亿美元的全球资本支出(CapEx)和运营支出(OpEx) 市场

对于潜在的“机器人取代人工”的担忧,黄仁勋也表达了自己的想法:

“虽然工作岗位会发生变化,有些工作可能会消失,但同时也会创造出许多新的工作岗位。以实体机器人为 agent 的机器人系统很可能会扩大全球的 GDP。这是因为,我们目前的劳动力依然短缺,大家都还能找到工作。例如,美国的失业率处于历史低位,原因就在于劳动力不足。餐馆很难招到足够的员工,许多工厂也很难招到足够的工人。

我认为,如果能以每年 10 万美元的价格雇佣一个机器人,人们会毫不犹豫地去做。原因在于,这会提高他们创造更多收入的能力。所以我认为,在未来 5 到 10 年里,我们很可能会看到 GDP 的增长,以及一个全新的行业——这些「token 制造系统」,人们也将逐渐理解它们。”

价值取决于,尽可能生成高质量 token

在今年的 GTC 大会上,黄仁勋曾展现出他对未来算力架构的理解。他提出了一个基础问题:一个数据中心的能源总量是有限的,无论是 100 兆瓦还是 250 兆瓦,真正决定价值的,是如何用这些能源生成尽可能高质量的 token



他表示:“我会毫不犹豫地选择雇佣一个年薪 10 万美元的智能体。”因为企业雇用一个人动辄几十万美元,如果可以用 10 万美元显著提升这些人的效率,那是显而易见的(明智)选择。

黄仁勋认为,现在的 AI 工厂需要处理覆盖帕累托分布的 token 需求曲线:创建一个系统能同时满足不同需求,在基础的服务中能够生成免费 token,在复杂任务和高要求的任务中生成高质量 token。

这就提出了一个架构难题:不能只针对某一种 token 做最优设计。他强调,如果架构过于碎片化,那么在不同部分之间来回移动工作负载就会变得困难;当设计一个在高速 token 率方面表现出色的系统时,通常它的整体吞吐量就会很低——“你可以挨着 X 轴(低延迟)做一个点,也可以贴着 Y 轴(高吞吐)做一个点,但很难覆盖整个帕累托曲线。”

为了解决这个问题,英伟达推出了 Dynamo,一个面向推理优化的数据中心级系统。Dynamo 将所有处理过程进行分解,并在数据中心内智能地分散这些处理任务,同时测量工作量以及处理器的负载情况,这确实是非常复杂的事情。

在黄仁勋看来,大模型推理并不是单一任务,而是一个由预填充(pre-fill)与解码(decode)组成的链式过程。预填充阶段需要从用户对话历史、文档中抽取信息并形成上下文,是一个极度依赖浮点计算的过程;而解码阶段则像是“思考”与“推理”,更依赖带宽,对精度的要求反而没那么高。

“Dynamo 本质上是一个 AI 工厂的操作系统。”黄仁勋说,Dynamo 就是在处理这些差异极大的需求中智能分配的核心系统,让整个数据中心像一个“超级 GPU”一样调度资源,使 token 的每一次生成都尽可能高效

完整访谈链接:

https://stratechery.com/2025/an-interview-with-nvidia-ceo-jensen-huang-about-chip-controls-ai-factories-and-enterprise-pragmatism/


来源:36kr

举报本楼

本帖有 3 个回帖,您需要登录后才能浏览 登录 | 注册
您需要登录后才可以回帖 登录 | 注册 |

版规|手机版|C114 ( 沪ICP备12002291号-1 )|联系我们 |网站地图  

GMT+8, 2025-5-22 21:11 , Processed in 0.163621 second(s), 17 queries , Gzip On.

Copyright © 1999-2023 C114 All Rights Reserved

Discuz Licensed

回顶部