通信人家园

 找回密码
 注册

只需一步,快速开始

短信验证,便捷登录

搜索

军衔等级:

  大元帅

注册:2007-12-102477
跳转到指定楼层
1#
发表于 2026-3-2 09:32:07 |只看该作者 |倒序浏览

当地时间3月2日,世界移动通信大会(MWC26)将在西班牙巴塞罗那开幕。观察者网从现场了解到,华为将首次在海外展示最新的Atlas 950 SuperPoD,以及TaiShan 950 SuperPoD等多个型号的超节点产品和解决方案,并强调坚持开源开放,打造坚实的算力底座,为世界提供新选择。


Atlas 950超节点首次出现在2025年的华为全联接大会上。


当时,华为轮值董事长徐直军介绍了昇腾950DT芯片,它更注重推理Decode阶段和训练场景。而Atlas 950超节点最大支持8192张昇腾950DT卡通过“灵衢”全光互联,这将是昇腾384超节点的20多倍。它的算力规模也将明显提升,其中FP8算力达到8E FLOPS,FP4算力达到16E FLOPS,互联带宽达到16PB/s。这个数字意味着,Atlas 950一个产品的总互联带宽,已经是今天全球互联网峰值带宽的10倍有余。


从算力规模、互联带宽等指标看,Atlas 950在未来多年都将是全球最强的超节点。相比英伟达在2026年下半年上市的NVL144,Atlas 950超节点卡的规模是其56.8倍,总算力是其6.7倍,内存容量是其15倍,达到1152TB;互联带宽是其62倍,达到16.3PB/s。即便与英伟达计划2027年上市的NVL576相比,Atlas 950超节点在各方面依然是领先的。


坦白来讲,昇腾芯片受限于制程,单卡指标将长期处于追赶的状态。那Atlas 950超越英伟达,就是单纯堆8192张芯片这么简单吗?观察者网之前也报道过,堆卡是提升国产算力规模的办法,但仅靠粗暴堆卡并不一定有好的效果。大模型参数规模已迈入万亿级时代,传统服务器堆叠的模式,面临集群规模越大,算力利用率越低,训练中断越频繁的困境。


超节点就是为解决传统计算集群面临的多重挑战而生。它从传统以CPU为中心的架构,变成了全平等互联,无论是CPU、NPU还是内存单元,都不用再经过CPU,而是能平等互联,提高通信效率,同时连接计算单元的“高速公路”也发生了变化,由全新的协议和总线能力来支撑设备间互联。一个真正的超节点,应该具备超大带宽、超低时延和内存统一编址等关键特点,实现逻辑上像一台计算机一样学习、思考和工作。


因此在开放的新型互联协议灵衢(UnifiedBus)支撑下,Atlas 950不仅是算力规模和内存容量提升,同时内存访问速度、互联带宽等能力也明显增强。相比昇腾384超节点,Atlas 950的训练性能提升17倍,达到4.91M TPS。通过支持FP4数据格式,Atlas 950的推理性能提升26.5倍,达到19.6M TPS。


根据观察者网了解,Atlas 950超节点预计将在今年上半年在国内发布,并在四季度上市。而这次在巴塞罗那亮相的除了Atlas 950,还有Atlas 850E超节点,但具体规格尚未公布。


与此同时,华为这次在巴塞罗那还将展示TaiShan 950 SuperPoD,以及TaiShan 500、TaiShan 200等系列新一代通算服务器,满足客户高、中、低算力选择。其中TaiShan 950是全球首个通算超节点。徐直军曾表示,TaiShan 950加上分布式GaussDB数据库,能帮助金融系统破解核心难题,将成为各类大型机、小型机的终结者,彻底取代各种应用场景的大型机和小型机以及Oracle的Exadata数据库服务器。


超节点足够强大,但支撑其运行的不只有芯片、光模块等硬件,还有大量软件生态,比如异构计算架构CANN、操作系统openEuler、数据库openGauss、AI框架MindSpore等等。华为表示,将始终坚持技术创新,开源开放,构筑坚实的算力底座,共建开放共赢的计算产业生态,为世界提供新选择。


举报本楼

本帖有 5 个回帖,您需要登录后才能浏览 登录 | 注册
您需要登录后才可以回帖 登录 | 注册 |

版规|手机版|C114 ( 沪ICP备12002291号-1 )|联系我们 |网站地图  

GMT+8, 2026-3-2 15:44 , Processed in 0.116972 second(s), 17 queries , Gzip On.

Copyright © 1999-2025 C114 All Rights Reserved

Discuz Licensed

回顶部