通信人家园

 找回密码
 注册

只需一步,快速开始

短信验证,便捷登录

搜索

军衔等级:

  大元帅

注册:2007-12-102122
跳转到指定楼层
1#
发表于 2025-9-28 10:41:21 |只看该作者 |倒序浏览
昇腾转型事件终于落下一只靴子。
近日,华为在全联接大会上正式公布了AI芯片路线图。一直摇摆于NPUGPGPU架构之间的昇腾,以SIMD/SIMT双编程模型给出答案——接下来,昇腾硬件将以“脚踏两只船”的方式渡过转型阵痛。在进军GPGPU的同时,NPU的影子仍被强留在历史舞台。
不过,即便此时NV深陷反垄断调查无暇他顾,国产GPGPU赛道依然强手辈出,对于转型夹缝中的昇腾,无论是抢占GPU通用计算市场,抑或稳住NPU存量份额,都存在未知因素。
昇腾GPGPU迈出一步,NPU路线拉开退场序幕?
918日,华为轮值董事长徐直军在主题演讲时对昇腾芯片路线予以重墨。从NPU时代的昇腾910,到当前正在开发、且即将推出的Ascend 950,以及后续规划中的960 970系列,这种跳跃式进阶计划释放出一个明显信号:昇腾正式向GPGPU赛道迈出一步。
据悉,此次昇腾芯片升级计划,意在支持更大的算力、满足更多场景需求。比如FP8算力从950系列的1 PFLOPS,提升到9602 PFLOPS9704 PFLOPSFP4算力则从9502 PFLOPS,提升到9604 PFLOPS9708 PFLOPS,补全NPU计算短板的意味十分明显。
尽管新品开发成果尚未落地,性能实测数据仍有待验证,但在产品迭进方向上,昇腾转向GPGPU架构已近乎实锤,客观上也再次对NPU高度定制化路线,进行了一次战略否定。
业内人士指出,昇腾NPU此前定位于ASIC路线,在特定任务上确实表现良好。然而,当前大模型应用正加速演变,NPU的效率和灵活性严重不足,一方面难以支撑快速变化的算子开发、适配、调优需求;另一方面在适配新算法或新框架时,工作量要远远高于GPGPU
相关数据显示,昇腾NPU + CANN 的方案迁移适配要以月度为单位,国产GPGPU + CUDA生态的方案则以天为单位。可以看出,两者仅在部署效率上差出10倍以上。而且,相较于GPGPU的可独立开发优势,昇腾后续开发严重依赖于华为技术人员支持,效果也往往不尽人意。
此前有爆料称,华为派了一整个工程师团队前往 DeepSeek ,帮助其使用昇腾芯片开发 R2 模型。但该模型始终无法在昇腾芯片上成功地进行训练。梁文锋甚至在内部表示,他对 R2 取得的进展并不满意。
这也呼应了徐直军的会上发言,“DeepSeek开源后,我们的客户对华为的昇腾发展指出了很多问题,也充满了期待,并一直在给我们不断地提建议。”显然,在用户市场倒逼之下,昇腾必须迈出GPGPU转型这一步,而NPU路线也在逐步完成谢幕。
SIMD/SIMT双编程模型,在油电之间妥协于混动?
作为华为投入7年之久的AI芯片路线,NPU的退场并不容易。尤其涉及到昇腾的存量市场份额和相关用户利益,在裹足不前与全面调头之间,华为选择了过渡式妥协。
据报道,昇腾在后续芯片产品中采用了创新的新同构设计,支持SIMD/SIMT双编程模型,SIMD能够像流水线一样处理“大块”向量,而SIMT便于灵活处理“碎片化”数据。
简单来说,就是要在NPUSIMD基础之上,嵌入式叠加GPGPUSIMT编程模型。其中,SIMD侧重数据并行,SIMT侧重线程并行。前者适用于CPU端的规则数据处理,后者更适用于GPU端的大规模并行计算。
此前,由于两大编程模型迥异,并且GPGPU主要面向图形和通用场景的资源分配逻辑,与昇腾主攻的固定神经网络任务的定制逻辑也截然不同,两者在架构上几乎无法兼容,也难以实现软件迁移。这一度引起昇腾用户对其转型后“无法维系软件栈更新”的担忧。
不过,SIMD/SIMT架构并行模式显露出浓重的过渡意味,并未在根本上解决昇腾转型带来的技术赶超压力、生态兼容不足、产品竞争力缺失等阵痛。
有人用油车和电车来形容编程模型差异,SIMD/SIMT更像是介于两者之间的混动车。“混动刚刚兴起的时候,普遍存在稳定性差、保值率低、维修成本高等问题。并且从技术竞争力角度讲,没有任何一家车企是专做混动车型的,最关键的还是要有自己的长板技术内核。”
上述人士认为,这一逻辑同样适用于芯片领域。
“虽然ARMAMD等国际大厂也在尝试技术融合(比如复杂指令集与精简指令集的双向奔赴),但这一切都建立在自身具备核心技术竞争力的前提下。”该人士指出,“NPU本身立足未稳,甚至在用户场景中频频掉队,贸然作这种技术复合题恐怕很难给出正解。”
[color=var(--weui-FG-HALF)]
384超节点扳回一城,NPU+GPGPU市场经略有望?
虽然双模型被认为是一场似是而非的技术妥协,但昇腾转型选择的时机却尽显微妙。有观点指出,转型前夕英伟达刚刚遭遇反垄断调查,更早些时候则是384超节点发布期,一前一后分别对应了华为的NPU存量份额和GPGPU增量市场。其中显然不乏某些商业利益考量。
众所周知,英伟达H20解禁初期国内订单暴涨,彼时业内普遍看好GPGPU路线,随后市场上即传出昇腾有意转向GPGPU的风声。与此同时,摩尔线程等国产GPGPU厂商集中冲击IPO,短短几天内将这一赛道热度快速推到顶点。
当然,包括英伟达阉割版芯片在内,国内GPGPU产品实力已经不容小觑,即便昇腾NPU面临用户投诉困境,但囿于技术差异化壁垒,短期内仍未传出进一步转型动作。
直到华为384超节点布局完毕,并且在市场上一度掀起“碾压英伟达”的巨大声浪,NPU市场阵脚业已堪堪稳住。紧随其后的英伟达反垄断调查,则直接引起国内强烈的反NV情绪,这也为昇腾试水GPGPU市场提供了更合适的契机——
如果在超节点概念加持下,进一步树立起昇腾GPGPU领先形象,华为将任意游走于两大市场版图。恰如徐直军此次演讲主题:“以开创的超节点互联技术,引领AI基础设施新范式”。
不过,商业领域的精妙谋划,无法改写充满逻辑理性的技术现实。有分析人士尖锐指出,“384超节点本质上还是NPU的一种堆叠方式,于单体芯片架构并无明显改进。而且相较于主流异构计算架构,昇腾超节点极度排外,封闭性更强,很容易对用户形成大范围绑定。”
上述人士认为,这种封闭模式下的强绑定效应,正是昇腾稳固现有NPU市场的安全绳。“随着昇腾新一代双架构芯片推出,受捆绑用户就是最好的试金石。退一步来讲,即便GPGPU转型未竟全功,昇腾也能在庞大的用户群中刷出经验值,丝毫影响不了其AI芯片市场利益。”
至于华为能否在双赛道中得偿所愿,不仅取决于SIMD/SIMT的魔改包装能力,也有待需求侧给出更多回响。但不管怎么说,昇腾确实需要来一场深刻变革了。
















举报本楼

本帖有 13 个回帖,您需要登录后才能浏览 登录 | 注册
您需要登录后才可以回帖 登录 | 注册 |

版规|手机版|C114 ( 沪ICP备12002291号-1 )|联系我们 |网站地图  

GMT+8, 2025-9-28 21:33 , Processed in 0.219166 second(s), 19 queries , Gzip On.

Copyright © 1999-2025 C114 All Rights Reserved

Discuz Licensed

回顶部