通信人家园

 找回密码
 注册

只需一步,快速开始

短信验证,便捷登录

搜索

军衔等级:

  中将

注册:2016-11-17336
跳转到指定楼层
1#
发表于 2026-1-6 09:43:40 |只看该作者 |倒序浏览

界面新闻记者 | 宋佳楠


北京时间1月6日凌晨,拉斯维加斯CES 2026展会现场,英伟达CEO黄仁勋发表了长达90分钟的主题演讲,正式宣布其新一代AI超级计算平台Vera Rubin已进入全面投产阶段。该平台的核心——Rubin GPU,推理性能达到了上一代Blackwell平台的5倍。


根据英伟达公布的数据,Rubin GPU搭载第三代Transformer引擎,NVFP4推理算力达到50 PFLOPS。训练性能方面,Rubin平台达到前代Blackwell的3.5倍;HBM4带宽22TB/s,为Blackwell的2.8倍;晶体管数量3360亿个,为Blackwell的1.6倍。


黄仁勋在演讲中指出,人工智能的发展重心正从“生成式AI”转向“代理式AI”和“物理AI”,AI模型能主动推理、解决问题,并学习自然法则。他表示,“宇宙中任何有信息的地方,都可以用大语言模型理解并转化为AI”。


为了支撑上述趋势,Vera Rubin平台采用了六芯片协同设计,集成了Rubin GPU、Vera CPU、NVLink 6交换机、ConnectX-9 SuperNIC、BlueField-4 DPU以及Spectrum-6以太网交换机。这一架构旨在系统性解决长期运行AI推理任务时面临的算力、网络和存储瓶颈,其目标是让AI“多想一会儿”变得经济可行,从而将推理成本降至Blackwell平台的十分之一,并将训练混合专家模型所需的GPU数量减少至四分之一。


此外,黄仁勋还展示了机器人实时交互、模拟环境,以及英伟达在机器人基础模型上的进展(如GR00T系列延伸)。他此前曾预测机器人将成为最大产业之一。


在自动驾驶领域,英伟达发布了全球首个开源的视觉-语言-行动推理模型Alpamayo。与传统自动驾驶系统不同,Alpamayo具备链式推理能力,能够理解复杂场景中的因果关系并解释其决策逻辑。


黄仁勋宣布,首款搭载英伟达完整自动驾驶技术栈的梅赛德斯-奔驰CLA车型将于2026年第一季度在美国上路。同时,英伟达大力推动其开源生态建设,扩展了名为“Open Model Universe”的开源模型库,覆盖了从机器人(GR00T)、物理AI(Cosmos)到生物医学(Clara)等多个关键领域。


对于开源AI模型,黄仁勋认为相比最前沿模型落后约6个月,但差距正在缩小。开源模型的崛起成为全球创新的催化剂,其中Deepseek R1的出现意外推动了整个行业的变革。


为了应对AI智能体长期运行产生的海量上下文数据对存储系统带来的挑战,英伟达还推出了由BlueField-4 DPU驱动的推理上下文内存存储平台。


该平台在GPU高速内存与传统存储之间建立了一个新的“记忆层”,旨在实现每秒处理令牌数提升最高5倍的效果,确保AI在长时间运行中保持稳定和高效。


不仅如此,新一代的DGX SuperPOD系统则能够将多达576个Rubin GPU协同工作,为超大规模AI训练和推理任务提供了集群级解决方案。


截至发布会当日,Rubin相关订单已达3000亿美元。随着这款“算力巨兽”的量产,AI驱动的工业转型与消费级智能设备革新正加速到来。

举报本楼

本帖有 6 个回帖,您需要登录后才能浏览 登录 | 注册
您需要登录后才可以回帖 登录 | 注册 |

版规|手机版|C114 ( 沪ICP备12002291号-1 )|联系我们 |网站地图  

GMT+8, 2026-1-8 06:53 , Processed in 0.114720 second(s), 16 queries , Gzip On.

Copyright © 1999-2025 C114 All Rights Reserved

Discuz Licensed

回顶部