|
3月30日消息,全国首个万卡昇腾910C超节点智算集群26日在深圳点亮。该项目由1.1万P新增算力与此前3000P一期叠加,形成总规模1.4万P智能算力,且全部基于国产先进芯片构建,是国内首个实现万卡级+全栈自主可控的智算集群,大规模国产算力底座进入可工程化部署阶段,验证了国产算力在可靠性、线性扩展与成本控制上的可行路径。
底座能力上,万卡规模是系统工程能力的体现,关键不在单卡性能,而在互联、调度与稳定性。项目实现全栈国产化,形成昇腾+CAAN软硬件协同体系,芯片、框架与集群管理链路闭环。
运行效率上,数据表明,一阶段3000P集群设备天均故障率仅为千分之零点三,大幅低于Meta等国际头部企业;此外Pangu-718B模型训练的线性度达到93.12%,说明在万卡规模下仍保持较高并行效率,性能比肩谷歌等国际头部企业的智算集群。这两个指标分别对应可用性和扩展性,是衡量超大集群是否具备商业化价值的核心参数。同时,通过液冷、自然冷源及一体化供电,持续优化PUE,作用于运营成本的降低。
生态与供给方面,算力不只取决于硬件规模,还依赖数据与调度体系。据悉项目提出下一步将加快自主可控算力资源统筹与扩容,通过算力一张网、一体化统筹、一站式调度,将分散算力转化为统一服务能力,并叠加语料供给与市场化运营,将算力由基础设施转化为可交易、可调用的生产要素。
|