查看: 817|回复: 13

华为这次什么都不想放弃！ [复制链接]

coffee198375

军衔等级：

大元帅

注册：2007-12-10 点赞数

2122

电梯直达

1^# 大中小

发表于 2025-9-28 10:41:21 |只看该作者 |倒序浏览

昇腾转型事件终于落下一只靴子。

近日，华为在全联接大会上正式公布了AI芯片路线图。一直摇摆于NPU与GPGPU架构之间的昇腾，以SIMD/SIMT双编程模型给出答案——接下来，昇腾硬件将以“脚踏两只船”的方式渡过转型阵痛。在进军GPGPU的同时，NPU的影子仍被强留在历史舞台。
不过，即便此时NV深陷反垄断调查无暇他顾，国产GPGPU赛道依然强手辈出，对于转型夹缝中的昇腾，无论是抢占GPU通用计算市场，抑或稳住NPU存量份额，都存在未知因素。
昇腾GPGPU迈出一步，NPU路线拉开退场序幕？
9月18日，华为轮值董事长徐直军在主题演讲时对昇腾芯片路线予以重墨。从NPU时代的昇腾910，到当前正在开发、且即将推出的Ascend 950，以及后续规划中的960、 970系列，这种跳跃式进阶计划释放出一个明显信号：昇腾正式向GPGPU赛道迈出一步。
据悉，此次昇腾芯片升级计划，意在支持更大的算力、满足更多场景需求。比如FP8算力从950系列的1 PFLOPS，提升到960的2 PFLOPS、970的4 PFLOPS；FP4算力则从950的2 PFLOPS，提升到960的4 PFLOPS、970的8 PFLOPS，补全NPU计算短板的意味十分明显。
尽管新品开发成果尚未落地，性能实测数据仍有待验证，但在产品迭进方向上，昇腾转向GPGPU架构已近乎实锤，客观上也再次对NPU高度定制化路线，进行了一次战略否定。
业内人士指出，昇腾NPU此前定位于ASIC路线，在特定任务上确实表现良好。然而，当前大模型应用正加速演变，NPU的效率和灵活性严重不足，一方面难以支撑快速变化的算子开发、适配、调优需求；另一方面在适配新算法或新框架时，工作量要远远高于GPGPU。
相关数据显示，昇腾NPU + CANN 的方案迁移适配要以月度为单位，国产GPGPU + CUDA生态的方案则以天为单位。可以看出，两者仅在部署效率上差出10倍以上。而且，相较于GPGPU的可独立开发优势，昇腾后续开发严重依赖于华为技术人员支持，效果也往往不尽人意。
此前有爆料称，华为派了一整个工程师团队前往 DeepSeek ，帮助其使用昇腾芯片开发 R2 模型。但该模型始终无法在昇腾芯片上成功地进行训练。梁文锋甚至在内部表示，他对 R2 取得的进展并不满意。
这也呼应了徐直军的会上发言，“DeepSeek开源后，我们的客户对华为的昇腾发展指出了很多问题，也充满了期待，并一直在给我们不断地提建议。”显然，在用户市场倒逼之下，昇腾必须迈出GPGPU转型这一步，而NPU路线也在逐步完成谢幕。
SIMD/SIMT双编程模型，在油电之间妥协于混动？
作为华为投入7年之久的AI芯片路线，NPU的退场并不容易。尤其涉及到昇腾的存量市场份额和相关用户利益，在裹足不前与全面调头之间，华为选择了过渡式妥协。
据报道，昇腾在后续芯片产品中采用了创新的新同构设计，支持SIMD/SIMT双编程模型，SIMD能够像流水线一样处理“大块”向量，而SIMT便于灵活处理“碎片化”数据。
简单来说，就是要在NPU的SIMD基础之上，嵌入式叠加GPGPU的SIMT编程模型。其中，SIMD侧重数据并行，SIMT侧重线程并行。前者适用于CPU端的规则数据处理，后者更适用于GPU端的大规模并行计算。
此前，由于两大编程模型迥异，并且GPGPU主要面向图形和通用场景的资源分配逻辑，与昇腾主攻的固定神经网络任务的定制逻辑也截然不同，两者在架构上几乎无法兼容，也难以实现软件迁移。这一度引起昇腾用户对其转型后“无法维系软件栈更新”的担忧。
不过，SIMD/SIMT架构并行模式显露出浓重的过渡意味，并未在根本上解决昇腾转型带来的技术赶超压力、生态兼容不足、产品竞争力缺失等阵痛。
有人用油车和电车来形容编程模型差异，SIMD/SIMT更像是介于两者之间的混动车。“混动刚刚兴起的时候，普遍存在稳定性差、保值率低、维修成本高等问题。并且从技术竞争力角度讲，没有任何一家车企是专做混动车型的，最关键的还是要有自己的长板技术内核。”
上述人士认为，这一逻辑同样适用于芯片领域。
“虽然ARM、AMD等国际大厂也在尝试技术融合（比如复杂指令集与精简指令集的双向奔赴），但这一切都建立在自身具备核心技术竞争力的前提下。”该人士指出，“NPU本身立足未稳，甚至在用户场景中频频掉队，贸然作这种技术复合题恐怕很难给出正解。”
[color=var(--weui-FG-HALF)]

384超节点扳回一城，NPU+GPGPU市场经略有望？

虽然双模型被认为是一场似是而非的技术妥协，但昇腾转型选择的时机却尽显微妙。有观点指出，转型前夕英伟达刚刚遭遇反垄断调查，更早些时候则是384超节点发布期，一前一后分别对应了华为的NPU存量份额和GPGPU增量市场。其中显然不乏某些商业利益考量。

众所周知，英伟达H20解禁初期国内订单暴涨，彼时业内普遍看好GPGPU路线，随后市场上即传出昇腾有意转向GPGPU的风声。与此同时，摩尔线程等国产GPGPU厂商集中冲击IPO，短短几天内将这一赛道热度快速推到顶点。

当然，包括英伟达阉割版芯片在内，国内GPGPU产品实力已经不容小觑，即便昇腾NPU面临用户投诉困境，但囿于技术差异化壁垒，短期内仍未传出进一步转型动作。

直到华为384超节点布局完毕，并且在市场上一度掀起“碾压英伟达”的巨大声浪，NPU市场阵脚业已堪堪稳住。紧随其后的英伟达反垄断调查，则直接引起国内强烈的反NV情绪，这也为昇腾试水GPGPU市场提供了更合适的契机——

如果在超节点概念加持下，进一步树立起昇腾GPGPU领先形象，华为将任意游走于两大市场版图。恰如徐直军此次演讲主题：“以开创的超节点互联技术，引领AI基础设施新范式”。

不过，商业领域的精妙谋划，无法改写充满逻辑理性的技术现实。有分析人士尖锐指出，“384超节点本质上还是NPU的一种堆叠方式，于单体芯片架构并无明显改进。而且相较于主流异构计算架构，昇腾超节点极度排外，封闭性更强，很容易对用户形成大范围绑定。”

上述人士认为，这种封闭模式下的强绑定效应，正是昇腾稳固现有NPU市场的安全绳。“随着昇腾新一代双架构芯片推出，受捆绑用户就是最好的试金石。退一步来讲，即便GPGPU转型未竟全功，昇腾也能在庞大的用户群中刷出经验值，丝毫影响不了其AI芯片市场利益。”

至于华为能否在双赛道中得偿所愿，不仅取决于SIMD/SIMT的魔改包装能力，也有待需求侧给出更多回响。但不管怎么说，昇腾确实需要来一场深刻变革了。

本主题由版主或管理员于 2025-9-28 10:49 审核通过

0 举报本楼

本帖有 13 个回帖，您需要登录后才能浏览登录 | 注册

返回列表

版规|手机版|C114 ( 沪ICP备12002291号-1 )|联系我们 |网站地图

GMT+8, 2025-9-28 21:33 , Processed in 0.219166 second(s), 19 queries , Gzip On.

Discuz Licensed

		自动登录	找回密码
密码			注册

华为这次什么都不想放弃！ [复制链接]

浏览过的帖子

浏览过的版块