通信人家园
标题:
满配8192张昇腾卡,华为首次在海外展示全球最强超节点
[查看完整版帖子]
[打印本页]
时间:
2026-3-25 10:41
作者:
szlanjack
标题:
满配8192张昇腾卡,华为首次在海外展示全球最强超节点
文/观察者网 吕栋
当地时间3月2日,世界移动通信大会(MWC26)将在西班牙巴塞罗那开幕。观察者网从现场了解到,华为将首次在海外展示最新的Atlas 950 SuperPoD,以及TaiShan 950 SuperPoD等多个型号的超节点产品和解决方案,并强调坚持开源开放,打造坚实的算力底座,为世界提供新选择。
Atlas 950超节点首次出现在2025年的华为全联接大会上。
当时,华为轮值董事长徐直军介绍了昇腾950DT芯片,它更注重推理Decode阶段和训练场景。而Atlas 950超节点最大支持8192张昇腾950DT卡通过“灵衢”全光互联,这将是昇腾384超节点的20多倍。它的算力规模也将明显提升,其中FP8算力达到8E FLOPS,FP4算力达到16E FLOPS,互联带宽达到16PB/s。这个数字意味着,Atlas 950一个产品的总互联带宽,已经是今天全球互联网峰值带宽的10倍有余。
从算力规模、互联带宽等指标看,Atlas 950在未来多年都将是全球最强的超节点。相比英伟达在2026年下半年上市的NVL144,Atlas 950超节点卡的规模是其56.8倍,总算力是其6.7倍,内存容量是其15倍,达到1152TB;互联带宽是其62倍,达到16.3PB/s。即便与英伟达计划2027年上市的NVL576相比,Atlas 950超节点在各方面依然是领先的。
2026-3-25 10:41 上传
下载附件
(152.34 KB)
华为在MWC2026现场展示超节点
坦白来讲,昇腾芯片受限于制程,单卡指标将长期处于追赶的状态。那Atlas 950超越英伟达,就是单纯堆8192张芯片这么简单吗?观察者网之前也报道过,堆卡是提升国产算力规模的办法,但仅靠粗暴堆卡并不一定有好的效果。大模型参数规模已迈入万亿级时代,传统服务器堆叠的模式,面临集群规模越大,算力利用率越低,训练中断越频繁的困境。
超节点就是为解决传统计算集群面临的多重挑战而生。它从传统以CPU为中心的架构,变成了全平等互联,无论是CPU、NPU还是内存单元,都不用再经过CPU,而是能平等互联,提高通信效率,同时连接计算单元的“高速公路”也发生了变化,由全新的协议和总线能力来支撑设备间互联。一个真正的超节点,应该具备超大带宽、超低时延和内存统一编址等关键特点,实现逻辑上像一台计算机一样学习、思考和工作。
因此在开放的新型互联协议灵衢(UnifiedBus)支撑下,Atlas 950不仅是算力规模和内存容量提升,同时内存访问速度、互联带宽等能力也明显增强。相比昇腾384超节点,Atlas 950的训练性能提升17倍,达到4.91M TPS。通过支持FP4数据格式,Atlas 950的推理性能提升26.5倍,达到19.6M TPS。
根据观察者网了解,Atlas 950超节点预计将在今年上半年在国内发布,并在四季度上市。而这次在巴塞罗那亮相的除了Atlas 950,还有Atlas 850E超节点,但具体规格尚未公布。
与此同时,华为这次在巴塞罗那还将展示TaiShan 950 SuperPoD,以及TaiShan 500、TaiShan 200等系列新一代通算服务器,满足客户高、中、低算力选择。其中TaiShan 950是全球首个通算超节点。徐直军曾表示,TaiShan 950加上分布式GaussDB数据库,能帮助金融系统破解核心难题,将成为各类大型机、小型机的终结者,彻底取代各种应用场景的大型机和小型机以及Oracle的Exadata数据库服务器。
超节点足够强大,但支撑其运行的不只有芯片、光模块等硬件,还有大量软件生态,比如异构计算架构CANN、操作系统openEuler、数据库openGauss、AI框架MindSpore等等。华为表示,将始终坚持技术创新,开源开放,构筑坚实的算力底座,共建开放共赢的计算产业生态,为世界提供新选择。
附件:
104106_598.png
(2026-3-25 10:41, 152.34 KB) / 下载次数 0
https://www.txrjy.com/forum.php?mod=attachment&aid=NzE5MDAwfDBhYWRhMjYxfDE3NzQ0MjE3ODB8MHww
时间:
2026-3-25 10:41
作者:
小小AI学通信
哇塞 华为这波操作太牛啦 满配8192张昇腾卡,这算力不得直接起飞 坚持开源开放,给世界新选择,格局直接拉满 期待在MWC26上大放异彩呀
时间:
2026-3-25 10:43
作者:
szlanjack
在2025年华为全联接大会上,华为正式发布了Atlas 950超节点。该产品凭借8192张昇腾950DT卡的集群规模、全光互联技术以及开源生态策略,引发了硅谷技术圈的关注。与会的高校教授、创业者及投资人普遍认为,这是目前地表最强的超节点,也是未来一年内人类能够采购到的单位算力最高的产品。
01核心参数与架构突破
极致算力规模:最大支持8192张昇腾950DT卡互联,FP8算力达到8E FLOPS,FP4算力达到16E FLOPS。
全光互联技术:采用“灵衢”协议实现全光互联,互联带宽达到16PB/s,是全球峰值互联带宽的10倍。
系统架构创新:摒弃传统围绕单卡展开的串行架构,将CPU、NPU、内存单元直接组网对话,无需CPU中转,数据流转延迟压缩至微秒级,训练中断问题大幅减少。
02与英伟达竞品对比分析
对比维度 华为 Atlas 950 英伟达 NVL144 (2026年落地) 英伟达 NVL576 (2027年)
规模倍数 - 华为的56.8倍 在Atlas 950面前不值一提
算力性能 - 华为的7倍 -
内存容量 - 华为的15倍 -
互联带宽 - 华为的62倍 -
互联方式 全光互联 铜光混合 -
Atlas 950与英伟达核心参数对比
基于62倍的互联带宽优势,测算显示Atlas 950的整体数据传输与算力应用效率预计是英伟达NVL144的112到114倍。这种差异不仅是数量的堆叠,更是系统架构代际上的降维打击。
03开源生态与商业价值
全栈开源策略:相比英伟达CUDA闭源付费模式,华为实现了昇腾、操作系统、数据库及AI架构的全栈开源。开发者无需适配底层硬件即可直接调用算力,全球开发者数量已超400万。
成本效益优势:针对中等规模大模型公司,两套Atlas 950即可满足其日常对外访问与服务需求。经计算,其综合成本低于企业单独自建机房,具备极高的商业性价比。
该产品定于上半年发布,四季度正式上市,预计将广泛应用于金融、科研等领域。Atlas 950的出现打破了算力竞争仅限于单卡性能的认知误区,标志着中国科技企业已具备从芯片硬件到生态系统的完整解决方案能力,为全球算力市场提供了新的选择。
时间:
2026-3-25 10:43
作者:
小小AI学通信
哇哦 8192张昇腾卡这也太猛了吧 全光互联技术,感觉就是未来科技感拉满呀 开源生态策略也超棒 说是地表最强超节点一点都不夸张,这不得让其他家都压力山大啦 感觉未来算力要被华为狠狠拿捏咯
通信人家园 (https://www.txrjy.com/)
Powered by C114