界面新闻记者 | 宋佳楠
北京时间1月6日凌晨,拉斯维加斯CES 2026展会现场,英伟达CEO黄仁勋发表了长达90分钟的主题演讲,正式宣布其新一代AI超级计算平台Vera Rubin已进入全面投产阶段。该平台的核心——Rubin GPU,推理性能达到了上一代Blackwell平台的5倍。
根据英伟达公布的数据,Rubin GPU搭载第三代Transformer引擎,NVFP4推理算力达到50 PFLOPS。训练性能方面,Rubin平台达到前代Blackwell的3.5倍;HBM4带宽22TB/s,为Blackwell的2.8倍;晶体管数量3360亿个,为Blackwell的1.6倍。
黄仁勋在演讲中指出,人工智能的发展重心正从“生成式AI”转向“代理式AI”和“物理AI”,AI模型能主动推理、解决问题,并学习自然法则。他表示,“宇宙中任何有信息的地方,都可以用大语言模型理解并转化为AI”。
为了支撑上述趋势,Vera Rubin平台采用了六芯片协同设计,集成了Rubin GPU、Vera CPU、NVLink 6交换机、ConnectX-9 SuperNIC、BlueField-4 DPU以及Spectrum-6以太网交换机。这一架构旨在系统性解决长期运行AI推理任务时面临的算力、网络和存储瓶颈,其目标是让AI“多想一会儿”变得经济可行,从而将推理成本降至Blackwell平台的十分之一,并将训练混合专家模型所需的GPU数量减少至四分之一。
此外,黄仁勋还展示了机器人实时交互、模拟环境,以及英伟达在机器人基础模型上的进展(如GR00T系列延伸)。他此前曾预测机器人将成为最大产业之一。
在自动驾驶领域,英伟达发布了全球首个开源的视觉-语言-行动推理模型Alpamayo。与传统自动驾驶系统不同,Alpamayo具备链式推理能力,能够理解复杂场景中的因果关系并解释其决策逻辑。
黄仁勋宣布,首款搭载英伟达完整自动驾驶技术栈的梅赛德斯-奔驰CLA车型将于2026年第一季度在美国上路。同时,英伟达大力推动其开源生态建设,扩展了名为“Open Model Universe”的开源模型库,覆盖了从机器人(GR00T)、物理AI(Cosmos)到生物医学(Clara)等多个关键领域。
对于开源AI模型,黄仁勋认为相比最前沿模型落后约6个月,但差距正在缩小。开源模型的崛起成为全球创新的催化剂,其中Deepseek R1的出现意外推动了整个行业的变革。
为了应对AI智能体长期运行产生的海量上下文数据对存储系统带来的挑战,英伟达还推出了由BlueField-4 DPU驱动的推理上下文内存存储平台。
该平台在GPU高速内存与传统存储之间建立了一个新的“记忆层”,旨在实现每秒处理令牌数提升最高5倍的效果,确保AI在长时间运行中保持稳定和高效。
不仅如此,新一代的DGX SuperPOD系统则能够将多达576个Rubin GPU协同工作,为超大规模AI训练和推理任务提供了集群级解决方案。
截至发布会当日,Rubin相关订单已达3000亿美元。随着这款“算力巨兽”的量产,AI驱动的工业转型与消费级智能设备革新正加速到来。
|