通信人家园

 找回密码
 注册

只需一步,快速开始

短信验证,便捷登录

搜索

军衔等级:

  大元帅

注册:2007-12-102704
跳转到指定楼层
1#
发表于 2026-6-17 11:05:50 |只看该作者 |倒序浏览
2019年的一纸制裁清单,掐断了中国AI产业依赖海外算力的捷径,英伟达技术退场、高端芯片断供涨价,国内大模型发展随后陷入“无卡可用”的困境。风口倾覆、壁垒高筑,合肥以国资布局、科大讯飞和华为以长期主义和硬核技术攻坚,三方携手踏足无人问津的算力荒原,在合肥南岗缔造首个国产万卡智算集群


01/

英伟达的工程师不来了


2019年10月8日,科大讯飞刚被美国政府列入实体清单,几天后,时任科大讯飞副总裁、AI工程院院长潘青华就收到了相熟的英伟达工程师的邮件:

“之后可能就来不了合肥了。”

之前的四到五年内,科大讯飞和英伟达中国一直走得很近。英伟达在世界范围内推广CUDA生态,讯飞研究院和工程院是中国最早一批使用英伟达卡做模型训练和推理的团队之一。几乎每年的NVIDIA GTC,讯飞都会参加;英伟达还没有上市的新产品,也都会拿给讯飞测bug。

但在实体清单之后,一切都天翻地覆。“英伟达的工程师过不来,也不可能再给我们新产品了”。

闻讯赶来的国产GPU厂商,几乎踏破了讯飞会议室的门槛。这些国产GPU厂商都相信,讯飞是国内最有可能走国产化芯片路线的科技公司之一。

一位业内人士称:“因为讯飞深入用过英伟达Telsa K20以来的多款GPU产品,能发现软硬件漏洞;而且他们具备CUDA底层代码开发和调优的能力。”

于是,三个国产替代的方案摆上公司决策层的案头,分别是:

“华为、海光和寒武纪”。


02/

昇腾到底行不行?


华为在2019年比讯飞早五个月被列入实体清单。这也让这对政治上的难兄难弟,有了在商业上联手的可能性。

由于谷歌和微软突然的技术断供,华为原计划2020年在欧洲发布P40手机,失去了语音助手和语音交互功能,而负责战略的余承东、邵洋在看到讯飞的语音能力后开始考虑:华为是否可以放弃自己的语音开发技术,转而全盘采用讯飞的语音解决方案。

另一方面,2019年8月,也就是讯飞被列入实体清单前两个月,华为刚刚发布了Ascend 910(昇腾910A)——一款达芬奇架构的自研AI处理器。昇腾910采用7nm工艺制程,半精度达256TFLOPs。

国产昇腾910A,同样也成为科大讯飞“换掉”英伟达的选项之一。

讯飞一位内部人士告诉元新闻,当年在昇腾芯片上,讯飞开展了约四五个月的优化,但性能还是未能达到和英伟达A100持平的目标,其性能只能达到英伟达A100的0.4倍水平。

当年,为了争取信任,华为从海思、中央研究院调集大量架构师和工程师赶赴合肥,其中包括2021年入职的“天才少年”张靖义 。华为甚至定下一个“激进”的交付时间表,明确承诺本月能达到 A100 多少比例、下月能实现多少突破。为了把“牛”吹圆了,华为的技术团队每天都奋战到凌晨两三点。

除去硬件性能,若只看软件应用性,昇腾大概是英伟达五年前甚至更早的水平。这也让讯飞的工程师们很不适应。因为在英伟达上调整模型,大概率不会出现问题,但在昇腾上却出问题。讯飞也曾就这些问题向工信部领导做过汇报。潘青华说:“要达到比较好的生态,可能还需要至少一两年的时间。”

AI芯片国产替代道路之艰难,超出了所有人的预期。

03/

合肥国资的超前布局


同一年,合肥国资也在悄然搭建国产算力底座。

合肥市大数据资产运营有限公司(下称“合肥大数据公司”)是由合肥市政府批准成立的国有全资企业,自2017年成立以来,一直承接数据领域政府重大基础性、系统性、示范性应用工程,统筹政府和社会数据运营。

但从2019年开始,合肥大数据公司开始进军算力基础设施建设运营领域,并谋建算力数据中心。2021年6月,合肥先进计算中心正式运行,系统建设规模为双精度计算峰值12PFlops,这就是大名鼎鼎的“巢湖明月”。

合肥大数据公司董事长屠冉告诉元新闻,最初布局算力集群时,在技术上有两条路线可选:第一条是采用非国产芯片,这在当时是技术主流;第二条是走全国产路线。

最终合肥选了“难而正确”的第二条路。合肥大数据公司相关人士告诉元新闻,“巢湖明月”一开始就选择建立自主可控的算力体系,“12P超算用的是寒武纪和海光的芯片”。

“巢湖明月”是超算中心,本质上是通用计算;但从2022年底开始,合肥大数据公司也开始布局“智算”领域。

一个最主要的原因,是市场的风向变了。“巢湖明月”是以高精度浮点运算、复杂科学仿真、大规模数值计算为核心,强调双精度和单精度;而在2022年11月底,OpenAI 上线 ChatGPT,直观展示了通用大模型的商业与技术潜力,谷歌、微软、Meta、亚马逊等科技巨头迅速跟进,全球资本、人才、资源快速向大模型赛道聚集,大模型也从前沿研究变为科技公司必争的核心战略,面向大模型训练和推理而生、优先强调半精度的“AI算力(智算)”成为市场的宠儿。

因此,2023年合肥大数据公司也开始建设一个100P的AI算力集群,为未来建设大规模AI算力集群积累经验。这一回,合肥选择的芯片同样是国产芯片——昇腾910A,此举也为日后与讯飞一起搭建国内首个基于昇腾芯片的超大规模AI集群,奠定了基础。


04/
飞星一号、X1


2022年底,在ChatGPT发布两周之后,科大讯飞也迅速做出决策:启动了认知大模型“1+N”攻关项目。其中“1”指的是通用认知智能大模型底座;“N”指的是将认知智能大模型技术,应用在多个行业领域——这就是“星火”。

在作出决策的一刹那,算力底座就成为决定“星火”成败的关键。

2023年5月6日,星火1.0发布。讯飞内部有一种说法:1.0是用之前攒下来的200多张卡的“家底”跑出来的。但再往下走,这点卡显然不够看。

科大讯飞面临的外部环境实际上比2019年还要糟糕:在前一年的10月7日,美国对包括科大讯飞等28家中国人工智能、高性能芯片、 超级计算机领域的头部企业和机构再次加码制裁,全链条封锁也彻底切断了讯飞和英伟达的连接。

而在两个月后,美国又扩大对中国芯片行业的打击力度,寒武纪被列入“实体清单”,这也将影响寒武纪在次年的出货。

此时此刻,讯飞的脑海中,算力自主可控的意识已经无比清晰:大模型必须依靠国产算力。用董事长刘庆峰的话说:绝不能把楼建在别人家的院子里。

一个好消息则是:昇腾的新版本要来了。2022年年底,华为推出910B新款芯片,但量产要到第二年。潘青华告诉元新闻,当时讯飞无法确定这款新品的实际性能。为此,他特地在春节前专门跑了一趟深圳,深入了解910B。

经过两个月的验证,潘青华有了几个重要的判断,第一,国产昇腾910B在2023年下半年可以量产;第二,讯飞已经跑通了高性能算力集群的网络方案RoCE,摆脱了IB方案( IB 老牌巨头Mellanox已被英伟达收购)的桎梏。

2023年5月6日,华为董事、毕业于中国科大的杨超斌来合肥参加了“讯飞星火1.0”成果发布会,并第一时间向任正非进行汇报。此后,任正非点名成立专项工作组,派了三位董事和多位总裁前往讯飞开会。

这一不寻常的举动直接拔高了合作层级——原本只是平台部门间的技术协作,就此升级为两家科技公司高层牵头的战略合作。6月2日,双方召开大模型技术攻关正式启动会议,联合项目组正式成立。

与此同时,代表合肥国资的合肥大数据公司开始入局——合肥智算算力科技有限公司随后成立,注册资本3.5亿,由科大讯飞旗下安徽讯飞云创科技有限公司与合肥市大数据资产运营有限公司共同持股——这又让之前两家科技公司的合作,从一场“国产芯片技术攻关”,演变成"华为昇腾负责硬件底座、 讯飞负责模型适配、 地方国企负责运营"的三方合作模式。

雄心勃勃的合肥要率先建立中国首个万卡规模的智算集群。在讯飞,这个项目被称为“飞星一号”,各取讯飞和星火一字;华为则管它叫“X1”,意为“华为算力的一号项目”。


05/
唐承文潸然泪下


首个国产万卡集群位于合肥南岗,就坐落在100PAI算力集群的楼上,占据了一整层楼。占地面积 7000m2,共632机柜,分布在6个机房,总算力为3200P,光电缆就有3.5万根。

讯飞以行业顶尖水平为目标,在与英伟达合作时力求极致优化,在适配昇腾的过程中,同样坚持高标准、严要求,不降低一丝一毫的性能基准。

潘青华担任“飞星一号”的技术负责人。他告诉元新闻,超大集群要满足三个目标:第一,时间上,国产的算力能支持国产大模型尽快实现对标GPT4,跻身世界领先水平。第二,性能上,不只是完成集群搭建,还要能最大化发挥效益。昇腾卡要对标英伟达(A100),用户一块钱买英伟达和一块钱买昇腾,获得的算力是一样的。第三,运行上,要保证大集群的常态化、稳定地运行。

“飞星一号”的Deadline被设定为2023年10月24日,讯飞计划在当天发布星火认知大模型V3.0时,“飞星一号”也要在那一天发布。

也就是说,讯飞一边要打仗(研发大模型),一边还要造打仗用的武器(建国产算力底座),两线作战,压力顶到满格。

从2023年7月到2023年10月,三方展开“百日攻坚”。时间之紧迫,机房都来不及新建而只能租赁;在“百日攻坚”开始时,讯飞手中仅有两台昇腾910B的样机,而量产机一直等到8月份才运抵合肥。

因为时间紧,讯飞甚至给工程院的工程师上了“智能外呼系统”。“哪怕是有一根线松了,系统自动触发呼叫同事的电话,呼叫他起来维护。” 一位参与过“百日攻坚”的工程院人士告诉元新闻。

结果三家携手,从0到1,硬是在一百天内就搭建出万卡级的高速互联,撑起算、存、网全栈自研架构,并提供底层算子库、开发工具链、集群调度等基础软件,多个攻关团队变成了一支统一的攻坚团队。

潘青华后来说,干活干到最后,他常分不清谁是讯飞的人,谁是华为的人,“大家的气质看上去都差不多”。

10月20日,首个国产万卡智算集群在南岗点亮,下午交付使用。当天晚上,在长江西路的一家饭店,组织了一次100人左右的团队聚餐。华为一位名叫唐承文的代表发表祝酒词,提及面对美国制裁,中国该自立自强时,潸然泪下。

06/
没有英伟达的日子


在合肥那场庆功宴的前三天,美国政府更新了针对AI芯片的出口管制规定,阻止英伟达等公司向中国出口先进的AI芯片。此时,英伟达的每张卡已涨价3-5万,A100芯片的售价更是高达20多万人民币。

但早早布局的讯飞显得从容不迫。

华为是在“飞星一号”之后,才真正意义上开辟出自己的国产算力版图的。相关人士告诉元新闻,当年在“X1(飞星一号)”搭建期间,华为在合肥高新区乐富强包下楼层,专门用于“战训”,各大区的人都来接受实战培训、考核。

2023年,互联网企业对昇腾芯片的采购量,多达上万张,尤其是头部互联网企业,态度尤为坚定;昇腾 910B后来累计出货了几十万张,成为国内可支撑万卡智算集群与自主大模型训练的主力 AI 芯片;而中国算力的出海,唯一做成的也只有华为。

从某种意义上来说,“飞星一号”正是昇腾一次壮丽的点火。

潘青华总结,从2023年至今,讯飞与昇腾在超大规模AI集群上的合作,展示了一条“从技术攻关到应用落地的一个完整的自主创新的路径”:

第一个阶段“敢用”。在2023年国内还没有超大规模集群的成熟方案时打造国内首个自主创新的超大规模集群;
第二个阶段“真用”。2023年到2024年,科大讯飞在昇腾超大规模集群上训练了星火大模型,性能从开箱只有业界的30%提升到了90%;
第三个阶段“会用”。2024年实现多种大模型在昇腾平台上的长稳训练,断点续训的恢复时间从业界平均的30分钟,下降到了5分钟以内;
第四个阶段“用好”。2025年3月基于昇腾算力率先实现了MoE模型的大规模跨节点并行集群的推理,性能提升了3倍。

屠冉则表示,国产软硬件正在从“可用”迈向“好用”,生态正逐步完善。“全栈自主可控技术体系比以往任何时候都更加重要”。

数据显示,国产万卡级集群一直稳定运行,负载率均值 84.59%、峰值 91.53%,有力支撑了国产星火大模型的数次重要迭代。

今年5月,刘庆峰说,所有中国主流大模型(下载量或销售额排名前十)中,“只有讯飞星火是全部用国产算力训练出来的”。

这是一条少有人走的路。毕竟,这个世界挣短钱的多,搞基建的人少,修好一条路给人用的少之又少。所有人都认可“建国产体系很重要”,可需要真金白银投入时,却很少有人勇于先行一步;若都不愿先行投入,只等待他人完成技术突破后再使用,那么中国的国产体系建设,将始终是零。

IDC数据显示,到2025年,中国市场的AI加速卡出货量已超400万块,国产芯片占比41%。尽管英伟达去年以55%市场份额排名第一,但较制裁前95%的市场份额相比已大幅下滑。

英伟达CEO黄仁勋在一场公开访谈中表示,公司已基本将中国AI芯片市场让给华为。
                        
从2024年开始,合肥市大数据公司在“东数西算”内蒙古枢纽节点全面启动建设合肥智算呼和浩特基地。元新闻获悉,当前,相关算力已陆续交付;昇腾950DT芯片也将于今年8月上线华为云平台,昇腾芯片还在以一年一代、算力翻倍的速度演进。告别英伟达,国产AI算力开始在封锁寒冬中快速萌芽和成长——潘青华七年前收到的那封邮件,也许正是世界的分叉点,在那之后,世界又多出一条路,本来没有路,走的人多了,就成了路。



举报本楼

本帖有 2 个回帖,您需要登录后才能浏览 登录 | 注册
您需要登录后才可以回帖 登录 | 注册 |

版规|手机版|C114 ( 沪ICP备12002291号-1 )|联系我们 |网站地图  

GMT+8, 2026-6-18 02:21 , Processed in 0.314406 second(s), 18 queries , Gzip On.

Copyright © 1999-2025 C114 All Rights Reserved

Discuz Licensed

回顶部