通信人家园

标题: 美光高管对存储的最新研判  [查看完整版帖子] [打印本页]

时间:  2026-7-1 16:31
作者: PH值     标题: 美光高管对存储的最新研判

半导体行业观察

内存是每一次重大计算变革背后的基础技术之一,如今它的重要性比以往任何时候都更加凸显。随着人工智能基础设施在训练、推理和大规模云部署等领域不断扩展,对高性能DRAM和存储的需求已迅速提升至行业议程的首要位置。无论是为最新加速器提供充足内存的HBM,在数据中心架构中扮演新角色的LPDDR,还是支持规模日益庞大的模型和数据管道的高速SSD,内存都已不再是物料清单中的普通商品。

这种转变以非常显著的方式改变了内存的经济格局。几十年来,内存行业一直遵循着周期性的发展模式,经历了产能过剩和调整的周期性波动,但当前的形势截然不同。人工智能进一步提升了内存的价值地位,使其从许多人视为普通商品的产品,转变为构建下一代基础设施的关键战场之一。如今,全球最大的公司不仅在争夺计算资源,还在争夺速度最快、密度最高的内存子系统,以及大规模部署这些系统所需的存储空间。正如本次采访中所指出的,我们现在看到的并非凭空而来的需求,而是多年来在服务器、智能手机、汽车和云计算等领域不断扩展的应用场景最终被人工智能加速推动的结果。

本次讨论的嘉宾是美光云内存业务部副总裁兼云内存产品总经理Praveen Vaidyanathan。他的职责范围涵盖了现代数据中心设计的核心内存技术,从基于HBM和LPDDR的服务器解决方案到越来越多地与加速计算配套使用的存储产品。在本次对话中,我们将探讨这是否真的只是又一个内存周期,随着人工智能需求的加速增长,内存市场发生了哪些变化,美光如何看待HBM4、定制内存、SOCAMM、LPDDR6和PCIe Gen 6 SSD,以及在需求可能在一个季度内发生巨大变化的市场中,提前数年进行容量规划意味着什么。

问:所以第一个问题是:这是一个周期吗?这是存储器行业,我们已经习惯了起起伏伏。这次有什么不同之处?

Vaidyanathan:我认为,如果回顾历史,答案是肯定的。然而,这是否是一个周期,三年后我们才能见分晓。我现在真的知道吗?可能还不能。但我认为,当前的情况实际上是由推动这一周期的基本面因素所致,也就是需求驱动因素。人们在什么情况下需要内存?回顾上世纪八九十年代,人们还把内存视为个人电脑的组件,一切就是从那时开始的。

最初是以KB为单位的内存占用;如今,这个数字已经截然不同了。一切由此开始,之后内存占用扩展到了每一个应用领域。您刚才提到了消费者;智能手机的出现改变了消费者的构成。这为内存占用提供了新的渠道,随后又进入了汽车领域。如今的汽车应用需要内存,之后服务器也应运而生。因此,内存在整个用户领域的应用范围已经非常广泛,我认为这种趋势是随着时间的推移而逐渐形成的。如今,超级周期正是由这些历史积累而成,再加上人工智能的出现,更是极大地推动了对内存和应用的需求。所以我认为,内存对于当今系统的架构至关重要,我们期待在这个环境中继续发展。

问:你说这是日积月累的结果,但如果我回顾一下最近的历史,也就是过去六个月,我认为在2025年第四季度,人们突然意识到,“等等,什么?它不再是一种普通商品了”。那个季度发生了什么变化?

Praveen Vaidyanathan:我们认为可能有两个因素在起作用。我认为随着人工智能的兴起——比如说2022年左右,生成式人工智能的雏形随着ChatGPT的出现而显现——人们开始更多地使用它,核心人工智能基础设施,尤其是加速计算能力,也获得了大量投资。随着人们在这方面的投资,我认为发生了两件事:前沿模型的持续增长以及代币成本的下降,都促进了人工智能应用的使用。

问:这有点像杰文悖论——降低价格,人们就会使用它。

Praveen Vaidyanathan:没错。我认为这种情况正在发生,你能预测到吗?当模型以三个月为周期迭代更新时,根本无法预测。所以这导致了需求的激增。除了加速器计算之外,我认为还有很多相关的配套计算资源,人们之前没有进行足够的投资,而现在这些投资突然变得必不可少。所以这两方面因素几乎同时爆发。但在这个行业里,我不明白为什么我们要对突如其来的事情感到惊讶。这种情况发生过多少次了?然后我们回过头来看,都会说:“当然,这显而易见。”

问:这就是为什么像美光和你们的竞争对手这样的公司每一代都在投资新技术。我们追踪最新一代工艺节点的工具销售情况,而目前的热点话题是从HBM3到HBM4的过渡,我们发现HBM4面临着一些不同的限制。您能解释一下美光是如何看待这些问题的吗?

Praveen Vaidyanathan:我们刚刚在GTC大会上宣布,我们的HBM4已经量产。去年我们实现了HBM3E的量产,现在我们推出了HBM4。HBM4有两个优点。一是它可以提高GPU内存的带宽。二是它持续优化能效曲线,因为我们需要更高的带宽,也就需要更高的性能,但功耗却有限制。HBM4确实做到了这一点,但每一代HBM的制造工艺也更加复杂,生产周期更长。因此,我们不仅要在产品周期和产品性能方面进行创新,还要在制造工艺方面进行创新。一旦有了这款产品,所有人都想要,都想尽快把它推向市场。所以,缩短生产周期和提高生产效率是我们必须持续努力的方向。

问:我一直觉得很奇怪的一点是,HBM 和 JEDEC 标准似乎有点不匹配,JEDEC 的速度可能稍慢一些,而对 HBM 的需求可能又稍快一些。这就是为什么像英伟达这样的大合作伙伴会要求比 JEDEC 更快的速度。那么,为了满足这样一个大客户的需求,我们需要额外投入哪些精力呢?

Praveen Vaidyanathan:我认为这对他们和其他一些客户来说都是如此。我认为你需要明白的是,一切都始于“客户想要什么?”。所以我们会提前与他们沟通,努力了解他们的需求。但我们也必须稍微超前一些,思考行业需要什么。如果带宽是HBM的关键能力,那么你就必须在这方面有所突破,做好准备。

JEDEC很有意思——它不会限制你的创作,而只是提供了一个通用平台。它使技术成为一种通用产品,但你仍然可以进行创新。例如,HBM4仍然满足所有JEDEC要求,但速度更快。因为我们都说过“我们要设计得更快”。我们的客户也说“我们想要达到那个水平”,所以我们就朝着那个方向努力了。因此,我们确实会考虑如何在两种环境下运作,因为说实话,标准化有助于推广应用。每个人都可以拿来用,这很有帮助。但同时,通用性也有不足之处,这也是定制化HBM出现的原因,有些人想要更多功能,他们也愿意与我们合作。

问:就定制而言,JEDEC 根据boding和其他规范定义了 HBM 的特定尺寸以及最大堆叠层数。您是否遇到过需要不同 XY 尺寸或不同高度(超出标准范围)的客户?

Praveen Vaidyanathan:也许会那样,谁知道呢。但这并非目前的趋势。目前的趋势是,你想保持一些不变的东西,但在此基础上,你还能做些什么呢?我们认为,未来会是加入更多标准 JEDEC 产品之外的功能和特性。

这就是我们为什么需要逻辑基础模具的原因。有了逻辑基础模具,你就能做更多的事情;而一旦升级到更高级的逻辑基础模具,你就能做更多的事情。

问:你们的基础芯片似乎采用了不同的工艺,因为你们使用的是内部的 20nm 工艺,而不是台积电的 N3 或三星的 SF4 工艺。这样做有什么好处?

Praveen Vaidyanathan: 我觉得这个问题你问得很好。我们并没有明确说过是20nm,这只是我们内部的一个通用逻辑流程,但从设计方法论的角度来看,这要从一开始。当我们开发HBM3E时,我们就预料到,随着这项技术的扩展,DRAM堆栈的创新将变得至关重要,因为从8层到12层再到16层,你只有一个基础芯片,但上面却集成了大量的DRAM。所以,如果你想优化性能和功耗,那就应该在DRAM上进行创新,尽可能地开发出最好的DRAM,然后再集成到你能找到的最好的逻辑芯片上。

我们的 HBM3E 实际上比市面上任何其他 HBM3E 都节能 30%。所以我们在这方面略占优势。如果升级到 HBM4,优势也一样:我们在 HBM3E 之前就已经实现了 20% 的能效提升,因此,在基础芯片上采用更先进的逻辑节点带来的收益并不大,而我们所有的创新都集中在顶层芯片上。我们评估了所有方面。我们说:“嘿,我们宁愿谨慎行事,确保不会遗漏任何东西。”

我想我们都是从小接受工程师熏陶长大的,很难摆脱这种思维模式。这种思维方式真的很有帮助:保持警惕,仔细评估一切。最终我们得出结论:凭借我们自身的逻辑,我们能够满足市场对速度和性能的需求。而且,由于所有技术都已内部开发,这也降低了我们的风险。我们无需依赖外部供应商。我们拥有成熟的DRAM技术,HBM3E和HBM4之间是相同的。因此,变更更少,风险更低,产能提升速度也更快。我们可能只用了三分钟就做出了这个决定,而这其中的关键原则,其实是在漫长的生命周期中反复斟酌的。

问:你们与封装公司的合作程度如何?因为很多HBM产品都是以CoWoS或立方体的形式封装的。我想你们必须确保所有产品都与他们的封装兼容。

Praveen Vaidyanathan:当然。我们有一个封装团队提前进行研发;事实上,我们封装团队的大部分成员都驻扎在台湾,那里是研发活动的中心。因此,我们与内部制造团队和外部制造合作伙伴紧密合作,共同完成这些项目。这是一个协同设计过程;封装设计与芯片设计同步进行。它们必须完全整合。我刚才提到的一些优势,比如我们拥有的功耗优势,实际上是通过一些封装技术实现的,这些技术有助于降低功耗。

问:比如集成式深沟槽电容器之类的东西?

Praveen Vaidyanathan:我们不做集成深沟槽电容器,而是更关注TSV(通孔硅片)和间距,以及用于散热的金属柱数量。封装设计需要您参与,两者最终会结合起来。随着时间的推移,情况会变得越来越复杂。

问:在GTC大会上,英伟达提到了HBM3、HBM3E、HBM4、HBM4E,然后又提到了HBM定制版。已经有人问我:这真的是定制版吗?还是在某种程度上仍然基于标准?

Praveen Vaidyanathan:我当然不能代表英伟达发言,但我们已公开表示,我们计划推出一条并行的产品线。我们会一直保留通用产品线,同时也会为能够从中挖掘额外价值的特定客户提供定制产品线。所以我认为这并非二选一的问题;某些应用场景非常适合使用 JEDEC 标准,而某些应用场景则需要定制的 HBM 标准。

问:由于需求如此之高,像贵公司这样的存储器企业是如何决定何时扩大产能的呢?这并非一朝一夕就能实现的;这需要超过200亿美元的投资和三四年的时间。如果能够预测需求,就可以提前建设;但如果无法预测,就会变得非常困难。

Praveen Vaidyanathan:总的来说,这是我们规划周期的一部分。让我举几个例子来说明我们规划的成果。看看我们之前发布的关于在美国生产制造的公告,这些公告都是提前几年制定的。虽然恰好在这个时候发布,但这是因为我们看到了地缘政治格局的变化以及在美国生产制造的机遇。另一个原因是,我们基于对行业产能需求的远见卓识,决定进行投资。我们不能对每一个细微的变化都做出反应;我们必须基于更广泛的长期行业展望。在过去几周,我们在印度启用了一家组装厂,最近在新加坡破土动工建设了一家HBM后端工厂,并且宣布了在日本扩建晶圆厂的计划。这一切都是对2025年第四季度业绩的回应吗?这不可能;这是多项正在进行的项目共同推动了我们所看到的市场需求增长。

问:去年你们宣布将在未来几年内向美国制造业投资1000亿美元。而且那还是在第四季度之前。

Praveen Vaidyanathan:没错。我们不可能预知未来。你必须基于对市场的最佳理解进行投资,贴近客户,然后在现有机遇中进行管理。但我们确实做了很多利用人工智能优化生产制造的工作。由于人工智能的应用,我们快速部署新技术的能力也大大提升。

问:在GTC大会上我们看到了Vera CPU刀片服务器。它有多少个SOCAMM模块?

Praveen Vaidyanathan:每个CPU是8TB。所以每个CPU最多可以支持2TB的内存。如果有8个CPU,那么就可以支持16TB的DRAM。

问:在这种工作负载环境下,有些应用需要大量的容量,而另一些应用则需要更快的内存。您是如何应对的?

Praveen Vaidyanathan:我们以SOCAMM为例。我们发布这款产品时,实际上我们有一个涵盖48Gb到2TB的完整产品组合,速度范围从7500MT/s到9600MT/s。那些不需要全部容量但追求最大带宽的用户会选择48Gb 9600MT/s的规格。而那些更注重容量但对速度要求不高的用户也会选择这款产品。数据中心的LPDDR内存应用到CPU领域只有两三年的历史。它在移动领域已经应用了很长时间。Hopper和Blackwell架构也已经使用了一段时间,但之前都是与GPU集成的。但现在,市场正在推动纯CPU解决方案的发展。随着智能AI的兴起,我们需要的产品组合也随之扩展。我们过去可以接受针对单一应用的单一解决方案,但现在我们需要一个包含多种速度的更广泛的产品组合。这是一个学习的过程;我们拥有广泛的产品组合,因此可以研究每一种应用场景。客户可能会尝试某些产品,然后改变主意。

问:在人工智能领域,人们销售rack scale系统时,他们主要追求的是产能吗?

Praveen Vaidyanathan:我认为这包含两方面。如果考虑GPU-CPU配置,带宽主要依赖于HBM显存。你当然希望HBM速度尽可能快,但你不可能把所有数据都压在HBM上。所以,你需要进行一些卸载,比如使用KV缓存等等。这就涉及到内存容量了。你需要确保内存带宽不低于互连带宽。只要满足这个要求,内存容量就至关重要。这是最低要求;除此之外,你还需要更大的内存容量。而如果只考虑CPU,我想每个人都希望拥有所有必要的功能。

问:我们开始听到一些关于LPDDR6的消息了。我认为量产可能会在2027年的某个时候进行。LPDDR6究竟能带来什么?

Praveen Vaidyanathan: LPDDR5 设计之初并非针对数据中心,数据中心功能是后来才考虑的。Nvidia 想将其应用于数据中心,所以我们与他们合作,探讨如何将其改造为适用于数据中心的内存。实际上,我们后来对 LPDDR5 进行了一些改造,使其具备了 RAS 和监控功能。而 LPDDR6 从一开始就支持这些功能,它是专为数据中心而设计的。

问:所以我们应该把LPDDR6视为内存的根本性重构吗?

Praveen Vaidyanathan:它的架构既适用于传统消费应用,也适用于数据中心。我们有机会提前思考,并加入有助于数据中心采用的功能。此外,SOCAMM 最初是专有解决方案,但现在 SOCAMM2 已成为行业标准解决方案,这有助于其推广应用。我们认为 LPDDR6 也将遵循同样的发展路径。

问: SOCAMM 的设计理念之一是实现了模块化 LPDDR。但是,您多久会看到合作伙伴更换一次 SOCAMM 呢?我每次看到它,都是在液冷系统中。如果要更换,就必须拆开系统内部。

Praveen Vaidyanathan:这项技术目前才刚刚上市,所以我们还没有相关经验。大多数解决方案,无论是否使用这项功能,拥有这项功能都能为客户提供更多选择。托盘级系统的情况则更为复杂,其维护也是客户面临的另一个问题。但这项功能意味着他们不必因为一个芯片故障而报废整个昂贵的托盘。

问:未来是否有可能出现采用 SOCAMM 式显存的消费级 GPU?

Praveen Vaidyanathan:我认为是这样。有一种叫做LPCAMM2的内存模块,是专为PC和笔记本电脑设计的。这种模块完全可以应用到其他解决方案中;关键在于如何将其融入到实际应用中。不过,为了避免用户觉得“我不需要这么多内存”,厂商设计了很多下置内存组件。

问:目前存在一些争议,讨论 GPU 供应商是否应该将内存与 ASIC 一起出售,或者他们是否希望内存能够灵活地与不同的 SKU 一起使用。

Praveen Vaidyanathan:这种设计的优点在于,它的外形尺寸不会随着容量或速度的变化而改变。

问:关于供电,你需要做些什么特别的事情吗?

Praveen Vaidyanathan:我们这里有稳压器,可以进行转换,将电压降到LP所需的水平,因为LP运行电压较低,所以模块中内置了电源管理功能。

问:人们能否在同一块ASIC芯片中设计LPDDR5和LPDDR6?还是说它们之间的差异太大了?

Praveen Vaidyanathan:这可以做到。你需要设计一个能够同时管理 I/O 和协议的 ASIC。但它们之间存在根本性的差异。例如,LPDDR5 的 I/O 是 16 位或 32 位的;而 LPDDR6 是 24 位或 48 位的。这是一个根本性的变化。

问:展望未来,你们为下一代存储器做了多大的准备?其他公司通常会谈到五到七年的探索期;存储器公司的情况是否有所不同?

Praveen Vaidyanathan:情况非常相似。技术探索和设计/架构探索是两个不同的阶段。技术探索往往耗时更长。因此,对我们来说,五到七年的时间可能更为适用,这主要是因为我们必须进行技术探索。我们讨论了12层HBM4,但我们也宣布已经展示了16层HBM4的能力,以证明我们具备相应的技术实力,以便在需要时做好准备。

问:我期待HBM的层数能和闪存一样多!上世纪80年代我们讨论的是KB级的容量;现在我们讨论的是GB级的容量。我相信10年后我们会需要数百TB的容量。对于关注美光的人来说,你们对2026年的展望是什么?

Praveen Vaidyanathan:您应该会看到我们全面的内存和存储产品组合,它们贯穿加速计算的各个环节。我们讨论了HBM4、SOCAMM,并且宣布我们率先将PCIe Gen 6 SSD推向市场,随着KV缓存的扩展,这些SSD的价值将更加凸显。我们希望成为一家以产品和技术为先的公司,始终走在时代前沿,提供合适的解决方案。

问:你们是否会与每代新客户建立合作关系?

Praveen Vaidyanathan:有时候是,这是一种战略选择。比如,当我们把LP-DRAM引入数据中心时,我们的合作伙伴是英伟达。有时候则是智能手机厂商。我们的客户在市场上竞争激烈,我们希望为他们提供最大的灵活性,帮助他们赢得市场。



时间:  2026-7-1 18:11
作者: wangheu2068

内存从PC配件变成AI基建核心组件,这个转变确实颠覆了行业认知。




通信人家园 (https://www.txrjy.com/) Powered by C114