通信人家园

 找回密码
 注册

只需一步,快速开始

短信验证,便捷登录

搜索

军衔等级:

  四级通信军士

注册:2017-8-14215
跳转到指定楼层
1#
发表于 2026-5-21 10:06:44 |只看该作者 |倒序浏览
美股盘后,英伟达公布了2027财年第一季度财报。营收和指引依旧超预期,但盘后依旧下跌了 1.3 个点。

640?wx_fmt=png&from=appmsg&watermark=1#imgIndex=0 市场关注的五大焦点
先看下市场上关于英伟达财报的 Preview,大家都在关心哪些问题。

1. 现金回报政策的提升潜力英伟达在 SPX 指数中占比高达8.3%,约78%的主动基金经理持有该股。这种极高的持仓度往往成为股价进一步上涨的阻力。其他大型科技公司通过提升现金回报来吸引股息/收益导向的投资者,但英伟达在2022-2025年仅将47%的自由现金流用于分红和回购,远低于同行约80%的水平。

2. Vera Rubin 的量产时间节点市场预期这一革命性系统将在2026年下半年开始量产,但具体的产能爬坡节奏和客户部署进度仍是焦点。

3. 毛利率的可持续性在持续的内存和其他成本通胀压力下,英伟达能否维持约75%的毛利率水平,这直接关系到其定价能力和成本控制能力的评估。

4. 1万亿美元收入目标的更新英伟达在 GTC 2026上提出的 Blackwell 和 Vera Rubin 平台2025-2027年累计收入1万亿美元的目标,是否会因为 LPU 机架、独立 CPU 以及 Vera Rubin Ultra 等新产品线的加入而上调。

5. 竞争格局的变化面对 Google TPU、Agentic CPU 以及其他 ASIC 芯片的竞争,英伟达的市场份额和技术优势是否依然稳固。

财报情况

下面看下实际的财报情况。

Q1 营收数据对比[td]
预期来源
金额
与实际差距
超预期幅度
管理层指引780亿美元+40亿美元+5.1%
市场共识预期789亿美元+31亿美元+3.9%
高盛预期800亿美元+20亿美元+2.5%
实际业绩820亿美元--

英伟达 Q1 营收达到 820 亿美元,不仅大幅超越管理层自己的指引,也显著高于市场共识预期。即便是最乐观的高盛预期,实际业绩也超出了约 20 亿美元。

这已经是英伟达连续多个季度的历史规律:根据美银的统计,过去 10 个季度英伟达平均超出当季预期 7-8%,折合金额约 2-4 亿美元。但这一次,超预期的绝对金额达到了前所未有的水平。

820亿美元的营收意味着:

  • 同比增长85% — 这是连续第三个季度同比增速加快
  • 环比增长20% — 连续14个季度实现环比增长

在如此庞大的基数上依然保持如此高速的增长,这在科技行业历史上极为罕见。

大家最关心的数据中心业务收入达到750亿美元,同比增长92%,环比增长21%。这一业绩主要由 Blackwell 架构驱动,其中 GB300和 NVL72需求尤为强劲。

更值得注意的是,超大规模客户和前沿模型厂商已累计部署数十万颗 Blackwell GPU,使其成为公司历史上产品上量(ramp)最快的季度。这一速度甚至超过了此前创纪录的 Hopper 架构。

Q2 营收指引对比[td]

预期来源
金额
与指引差距
超预期幅度
市场共识预期861亿美元+49亿美元+5.7%
英伟达 Q2 指引910亿美元±2%--
环比 Q1 增长-+90亿美元+11%

英伟达给出的 910 亿美元 Q2 指引,远超市场共识预期的 861 亿美元,意味着指引本身就已经超出市场预期约 49 亿美元。

高盛分析师在财报前就指出,市场的焦点已经从 Q1 的实际业绩转移到 Q2 的指引上。因为连续多年的超预期表现,已经让 Q1 的“beat”成为了一种形式,真正决定股价走向的是公司对未来增长的信心。

910 亿美元的 Q2 指引意味着环比将再增长约 11%,这在如此高的基数上依然保持两位数增长,充分展现了 AI 需求的持续旺盛。

现金回报政策的重大突破
在市场最关心的现金回报问题上,英伟达终于做出了实质性回应:

  • 季度股息从1美分大幅提升至25美分 — 提升25倍
  • 新增800亿美元股票回购授权 — 叠加现有390亿美元剩余额度,总计约1190亿美元
  • 计划今年返还约50%自由现金流给股东 — 虽然仍低于同行80%的水平,但已是重大进步

美银分析师认为,如果英伟达将股息收益率从当前的0.02%提升至0.5%-1%(与苹果、微软看齐),仅需占用2026年自由现金流的15%-30%,但却能显著扩大投资者基础,吸引更多收益导向的机构投资者。

电话会上的几个关键问题
英伟达把数据中心业务拆成两块:Hyperscale 市场(5-6家云巨头)收入380亿美元,环比增长12%;ACE/Enterprise 市场(数十万企业客户)收入370亿美元,环比增长31%。两个市场规模接近,增速差了快3倍。ACE 市场覆盖全球50-80万亿美元经济规模,客户需要集成化方案,几乎没有竞争对手。管理层明确说,公司增长会快于 hyperscaler 资本支出增速。

市场担心 CPU 会蚕食 GPU 需求。管理层澄清:在 Agentic 应用中,CPU 负责 I/O 和编排,GPU 负责推理,两者互补不替代。今年预期的近200亿美元独立 CPU 收入不包含 Vera Rubin 系统里的 CPU,是打开2000亿美元新市场的纯增量。

推理市场份额在快速提升。新增 Anthropic、Cursor、Perplexity 等客户,与 Anthropic 深度合作在多个云平台扩展容量。Vera Rubin 预计比 Blackwell 更成功,推理吞吐量提升35倍。ACE 市场的推理需求几乎全部由英伟达满足。

GTC 2026提出的1万亿美元收入目标(Blackwell+Rubin,2025-2027)不包含独立 CPU、Rubin Ultra 等产品线。、Vera CPU和LPX是1 万亿美元之外的最大上行来源。

LPX 当前市场占比远低于20%,与主流 GPU 互补不替代。Vera Rubin 计划2026年 Q3开始出货,Q4爬坡,2027年 Q1显著增长。系统复杂(7款芯片、5个机架),初期爬坡可能相对平缓,但需求端已有主要客户订单。

还有一个容易被忽视的数字:库存及预付采购承诺总额增至 1450 亿美元。这个数字相当于英伟达接近两个季度的营收规模,在科技行业几乎没有先例。它说明了三件事:第一,英伟达对未来 2-3 年的订单能见度极其清晰,这不是赌博,而是长期合同已经签到手;第二,公司正在用现金流提前锁定台积电的 CoWoS 先进封装产能、SK 海力士和三星的 HBM 产能,当你把 1450 亿美元压在供应链上时,竞争对手想要扩产就会遇到产能瓶颈;第三,这是为 Vera Rubin 的大规模量产做准备,7 款芯片、5 个机架的复杂系统,需要在供应链的每一个环节都提前布局。从某种意义上说,这 1450 亿美元本身就是一道护城河。

英伟达的护城河到底有多宽
过去两年,关于“英伟达会不会被 ASIC 取代”的讨论从未停止。Google 的 TPU、AWS 的 Trainium、Meta 的 MTIA,每一款定制芯片的发布都会引发一轮“英伟达要被颠覆”的讨论。但现实是,英伟达的市场份额不仅没有被侵蚀,反而在持续扩大。

CUDA 经过18年的积累,已经形成了一个几乎不可能被短期复制的开发者网络。每一个新的 AI 框架、每一个优化库、每一个预训练模型,默认都是为 CUDA 优化的。这意味着即便定制芯片在硬件层面做到了性能对标,在软件层面依然需要大量的适配工作。对于绝大多数企业客户来说,这个迁移成本是不可接受的。当然不可否认的是,现在 CUDA 的护城河效应正在减弱。

大摩最近做了一个详细的成本拆解:建设一个 1GW 算力的数据中心,用当前一代的 Blackwell GPU 需要约 330 亿美元,而用 TPUv7 或 Trainium3 只需要 270 亿和 150 亿美元。看起来定制芯片便宜近一半。但问题在于,这个成本差距主要来自芯片本身的价格——Blackwell 单颗芯片约 3.5 万美元,而 TPUv7 约 1.6 万美元,Trainium3 只有 7000 美元。

640?wx_fmt=jpeg&from=appmsg&watermark=1#imgIndex=1

可当你把每瓦算力性能算进去,英伟达 GB300 能做到 6.8 TFLOPs/瓦,TPUv7 是 4.3,Trainium3 只有 2.5。换句话说,云服务商为了省芯片采购成本,最终要在电费、散热、机房空间上付出更多代价。

640?wx_fmt=jpeg&from=appmsg&watermark=1#imgIndex=2

博通(Broadcom)在网络交换机 ASIC 领域的反击值得关注。在 AI 集群中,交换机芯片的重要性不亚于计算芯片本身——当你需要连接数万颗 GPU 协同工作时,网络带宽和延迟直接决定了整体性能。博通在这个细分市场的技术积累让它成为英伟达为数不多需要正视的对手。但即便如此,博通的机会也更多集中在超大规模云服务商的定制需求上,而非通用市场。

超大规模云服务商的自研芯片策略也在分化。Google 依然坚定投入 TPU,AWS 在 Trainium 和 Inferentia 上持续迭代,Meta 则相对谨慎。但这些自研芯片更多是作为“第二供应商”存在——用于特定的内部工作负载,降低对单一供应商的依赖,但并不打算完全替代英伟达。原因很简单:当你的客户需要在你的云平台上运行各种第三方 AI 模型时,英伟达 GPU 依然是唯一能保证兼容性的选择。

这就是为什么英伟达能够在“被竞争”的叙事中持续增长。它不是没有对手,而是对手们发现,要在通用性、性能、生态三个维度同时超越英伟达,难度远比想象中大。定制芯片可以在某个单点上做到更优,但 AI 市场需要的是一个完整的解决方案——从硬件到软件,从训练到推理,从云端到边缘。在这个维度上,英伟达的领先优势不是在缩小,而是在扩大。

GPU 直接读取 SSD
在财报发布前不久,英伟达与亚马逊合作开发的一项技术突破引发了产业界的广泛关注:GIDS(GPU-Initiated Direct Storage,GPU 发起的直接存储访问)架构。之所以单独讨论这个技术,是因为存储架构正在成为 AI 算力竞赛中的新焦点——当算力不再是唯一瓶颈时,如何高效地管理和调用海量数据,决定了下一代 AI 系统的性能上限。

传统的数据中心架构中,GPU 需要读取存储数据时,必须先通过 CPU 发出指令,CPU 再从 SSD 读取数据,然后传递给 GPU。这个“中转”过程不仅增加了延迟,也让 CPU 成为瓶颈。在 AI 推理场景中,当模型需要频繁访问大量上下文数据(KV Cache)时,这个瓶颈会被无限放大。

GIDS 架构彻底改变了这个流程:GPU 可以直接向 SSD 发出读写指令,完全绕过 CPU。配合高带宽闪存(HBF)技术,这套架构能将 AI 模型的可用内存容量提升16倍以上。具体来说,通过将6个 HBF 堆栈与2个 HBM 堆栈结合,单个 GPU 封装可以承载约 3120GB 的总内存——而当前仅使用8个 HBM 堆栈的配置只有 192GB。

这个突破的意义在哪里?当 AI 模型越来越大,当推理任务需要处理的上下文越来越长,内存容量正在成为新的瓶颈。Claude Code 或 Cursor 这类代码助手,成本大头不是生成代码本身,而是反复加载代码仓库的上下文。如果能把这些上下文缓存在 SSD 中,需要时由 GPU 直接调取,推理成本能降一大截。

现在存储显然已经成为了 AI 的一个瓶颈,所以各个大厂都在做自己的应对措施,无论是英伟达的 CMX 方案、谷歌的 CXL 内存池,还是上面提到的 GIDS,以及 LPX 的 SRAM 方案,本质都是想着如何高效利用 Memory,提高推理的性价比。从这一点来看,以后无论哪家又出了一个新的算法说可以节省 xx 的存储,我们都不应该觉得惊讶,因为这件事是大家每天都在做的。


举报本楼

本帖有 4 个回帖,您需要登录后才能浏览 登录 | 注册
您需要登录后才可以回帖 登录 | 注册 |

版规|手机版|C114 ( 沪ICP备12002291号-1 )|联系我们 |网站地图  

GMT+8, 2026-5-22 02:12 , Processed in 0.212439 second(s), 20 queries , Gzip On.

Copyright © 1999-2025 C114 All Rights Reserved

Discuz Licensed

回顶部