查看: 830|回复: 6

性能达Blackwell的5倍！黄仁勋发布新一代Rubin GPU [复制链接]

PH值

军衔等级：

中将

注册：2016-11-17 点赞数

336

电梯直达

1^# 大中小

发表于 2026-1-6 09:43:40 |只看该作者 |倒序浏览

界面新闻记者 | 宋佳楠

北京时间1月6日凌晨，拉斯维加斯CES 2026展会现场，英伟达CEO黄仁勋发表了长达90分钟的主题演讲，正式宣布其新一代AI超级计算平台Vera Rubin已进入全面投产阶段。该平台的核心——Rubin GPU，推理性能达到了上一代Blackwell平台的5倍。

根据英伟达公布的数据，Rubin GPU搭载第三代Transformer引擎，NVFP4推理算力达到50 PFLOPS。训练性能方面，Rubin平台达到前代Blackwell的3.5倍；HBM4带宽22TB/s，为Blackwell的2.8倍；晶体管数量3360亿个，为Blackwell的1.6倍。

黄仁勋在演讲中指出，人工智能的发展重心正从“生成式AI”转向“代理式AI”和“物理AI”，AI模型能主动推理、解决问题，并学习自然法则。他表示，“宇宙中任何有信息的地方，都可以用大语言模型理解并转化为AI”。

为了支撑上述趋势，Vera Rubin平台采用了六芯片协同设计，集成了Rubin GPU、Vera CPU、NVLink 6交换机、ConnectX-9 SuperNIC、BlueField-4 DPU以及Spectrum-6以太网交换机。这一架构旨在系统性解决长期运行AI推理任务时面临的算力、网络和存储瓶颈，其目标是让AI“多想一会儿”变得经济可行，从而将推理成本降至Blackwell平台的十分之一，并将训练混合专家模型所需的GPU数量减少至四分之一。

此外，黄仁勋还展示了机器人实时交互、模拟环境，以及英伟达在机器人基础模型上的进展（如GR00T系列延伸）。他此前曾预测机器人将成为最大产业之一。

在自动驾驶领域，英伟达发布了全球首个开源的视觉-语言-行动推理模型Alpamayo。与传统自动驾驶系统不同，Alpamayo具备链式推理能力，能够理解复杂场景中的因果关系并解释其决策逻辑。

黄仁勋宣布，首款搭载英伟达完整自动驾驶技术栈的梅赛德斯-奔驰CLA车型将于2026年第一季度在美国上路。同时，英伟达大力推动其开源生态建设，扩展了名为“Open Model Universe”的开源模型库，覆盖了从机器人（GR00T）、物理AI（Cosmos）到生物医学（Clara）等多个关键领域。

对于开源AI模型，黄仁勋认为相比最前沿模型落后约6个月，但差距正在缩小。开源模型的崛起成为全球创新的催化剂，其中Deepseek R1的出现意外推动了整个行业的变革。

为了应对AI智能体长期运行产生的海量上下文数据对存储系统带来的挑战，英伟达还推出了由BlueField-4 DPU驱动的推理上下文内存存储平台。

该平台在GPU高速内存与传统存储之间建立了一个新的“记忆层”，旨在实现每秒处理令牌数提升最高5倍的效果，确保AI在长时间运行中保持稳定和高效。

不仅如此，新一代的DGX SuperPOD系统则能够将多达576个Rubin GPU协同工作，为超大规模AI训练和推理任务提供了集群级解决方案。

截至发布会当日，Rubin相关订单已达3000亿美元。随着这款“算力巨兽”的量产，AI驱动的工业转型与消费级智能设备革新正加速到来。

本主题由版主或管理员于 2026-1-6 09:54 审核通过

0 举报本楼

本帖有 6 个回帖，您需要登录后才能浏览登录 | 注册

返回列表

版规|手机版|C114 ( 沪ICP备12002291号-1 )|联系我们 |网站地图

GMT+8, 2026-1-8 06:53 , Processed in 0.114720 second(s), 16 queries , Gzip On.

Discuz Licensed

		自动登录	找回密码
密码			注册