|
6月15日,在“理想汽车家庭科技日”活动上,理想汽车董事长兼CEO李想正式发布了自研AI芯片“马赫M100”。理想汽车CTO谢炎则详细阐述了理想为何要自研芯片以及马赫M100的详细规格和技术突破。
为何要自研AI芯片?算力供需矛盾倒逼架构创新
理想汽车CTO谢炎在发布会上首先回顾了近年来半导体行业面临的根本性困境:摩尔定律与登纳德缩放定律双双失效。
谢炎指出,上世纪八九十年代,计算机行业享受着摩尔定律(每两年晶体管数目翻倍)和登纳德缩放定律(晶体管缩小后,电压、电流同步下降,功耗不增反减)的双重红利。这也使得处理器主频从100MHz一步步轻松涨到2GHz,程序员写完代码一行不改,仅依靠两年后芯片制程的提升,性能就能自动翻倍。
然而,这一红利在2004年前后开始终结。当晶体管缩小到65nm后,漏电问题爆发,电压难以继续下降,芯片热到“可以煎鸡蛋”。登纳德缩放定律失效,主频提升开始停滞。2010年之后,摩尔定律也开始放缓,每一代制程带来的性能提升从以往的翻倍降至30%、20%、10%。
与此同时,自2012年深度学习革命点燃以来,尤其是2015年大模型时代爆发后,AI算力需求开始出现爆炸式增长,2025年进入智能体时代,AI推理需求更是完全超出任何人的最疯狂预测。
“所以我们面对的现实是:算力的供给在放缓,算力的需求在增长。这个矛盾是整个行业的矛盾,也是我们必须回答的问题。”谢炎表示。
造成这一矛盾的另一个关键原因是,过去的计算架构主要都是基于“冯·诺依曼架构”。1945年提出的这套架构是将计算抽象成一条顺序执行的指令队列,一条指令完成再执行下一条。这套架构之所以成功,是因为它极其契合人类大脑的推理思维习惯,统治了计算机行业整整70年。
但它的根本性代价是:指令队列掩盖了计算本有的并行度。为了弥补架构的局限,冯·诺依曼架构需要使用海量晶体管来做“真正计算以外的管理开销”——缓存、调度机制、分支预测等。当遇到AI计算这种海量规模的并行计算时,这些开销同步增长,效率难以提升。
李想也指出,当前大多数芯片仍基于冯诺依曼架构,而AI时代的需求将推动芯片在架构层面发生巨大变革。理想汽车希望将AI带入物理世界,并带给用户类似苹果的体验,这需要依靠软硬一体的联合设计来达成卓越体验。为此,理想需要同步自研芯片、操作系统、大模型与硬件,进行面向人工智能时代的“全域联合设计”。
李想强调,自研芯片“不是烧钱跟风”,也并非为了证明自身技术能力,而是“为了让AI在物理世界能真正跑起来,用自研芯片解决当前供应商技术无法攻克的难题”。
马赫M100:全球首款数据流架构AI芯片
那么在摩尔定律与登纳德缩放定律红利双双消失的背景下,如何破解冯·诺依曼架构所带来的困境呢?
对此,谢炎指出,当砖头(晶体管)的质量和数量都无法大幅提升时,我们就需要“重新发明盖楼方式”:拆掉中央式的指令队列及其伴随的大量管理开销,让数据的流动来驱动计算的发生,让架构本身围绕AI的计算形态来延伸设计。这就是数据流架构,是AI时代盖楼的新方式。
理想汽车此次正式发布的自研AI芯片“马赫M100”正是全球首款数据流架构AI芯片。
据介绍,马赫M100采用“网格总线加数据环形总线”双互连架构,网格总线支持高带宽点对点通路,数据环形总线提供确定性的广播通路,数据在阵列中流动,数据流到哪里就在哪里触发计算——这就是“数据流驱动计算”的核心。
在核心规格方面,马赫M100 SoC采用5nm车规级制程工艺,基于自研的动态数据流架构,拥有24个2.3GHz Arm Cortex-A78AE核心,主要负责安全和系统控制。
集成的马赫M100 NPU则占据了整个SoC一半的面积(拥有56个计算单元+1个数据处理模块),单颗算力可达1280 TOPS。算力利用率更是超过82%,远超传统芯片。内存系统方面,支持8个LPDDR5x通道,带宽高达273GB/s。
谢炎强调,马赫M100是目前全球量产最强大的车规级算力芯片,即便是基于SMT架构的GPGPU,要达到马赫M100的超过82%实际算力利用率也是非常困难的。
谢炎在现场也展示了马赫M100与全球主流的车规AI芯片英伟达ThorU的实测数据对比结果。在CNN骨干网络、UniAD、马赫VLA(理想自动驾驶大模型技术方案)等测试中,马赫M100全部超越英伟达ThorU,并且“不是略微领先,是数倍的性能差距”。
在通用大模型推理能力方面,在Qwen3.5-35B(350亿参数)通用大模型上,马赫M100与售价4万元的桌面超算英伟达DGX Spark对比结果显示:马赫M100的Prefill性能是DGX Spark的2.7倍;马赫M100的解码性能是DGX Spark的1.5倍。
谢炎还宣布,马赫M100架构的论文已被ISCA 2026(国际计算机体系结构顶级会议)收录。理想汽车也是汽车行业中第一家在ISCA获得论文录取的企业。
全栈自研的安全体系
对于车企来说,安全是最为重要的生命线。而自研芯片本身也为车企带来了更高的安全价值。
在发布会现场,当谢炎提出“苹果手机安全,还是安卓手机安全?”这个问题时,现场参会者都给出了“苹果手机更安全”的答案。而这其中的关键就在于苹果手机从芯片到操作系统的软硬件是协同设计的。
“苹果把芯片和操作系统放在一起设计,它的安全不是系统启动之后才开始,而是从芯片上电那一刻就已经开始。”谢炎解释道。 同样,理想将密钥保护、设备身份、可信启动链、关键权限管控也全部前置到马赫M100的芯片设计中,再通过全栈自研的软件实现统一调度,大幅提升了整个系统的安全性。
理想汽车基座模型负责人詹锟也指出,在双马赫M100芯片的强大算力的支持下,理想自动驾驶大模型技术方案(VLA)的模仿学习规模提升了50%,强化学习规模提升15倍,模型参数量提升10倍,模型计算量提升15倍。随着理想VLA能力的全面升级,也直接驱动了理想汽车智能驾驶能力的质变,智驾安全性也随之显著提升。
具体来说,马赫VLA模型可自主完成倒车让路、识别交警手势指挥、应对低矮不规则障碍物、穿越无车道线的城中村雨夜窄路等过去难以靠规则实现的场景,极大地提升了智驾的安全性。这一切的背后都是算力、数据、模型规模和架构的同时跃升。
据介绍,得益于理想软硬件全栈自研的架构,使得视觉输入——模型推理(原生多模态MoE混合专家大模型取代了传统模块化模型,让感知、理解、思考与行动在同一框架内对齐)——底盘响应——系统调度整条链路全部变短,实现了马赫VLA端到端大模型响应延迟降低到了0.28秒,相比人类司机的反应速度快了接近40%。
不止于智能驾驶
谢炎进一步指出,马赫M100的能力远不止于智能驾驶——它今天已经跑通了车上所有的智能化场景,能运行语言大模型,能支撑AI计算,将驱动具身智能,还会支持更多尚未想到的AI场景。“马赫M100会持续进化,更强、更快、更智能。这就是我们造这个芯片的原因——不是为了今天,是为了接下来70年。”
据介绍,在马赫M100基础上,理想汽车构已经建了完整的具身智能系统。其中,马赫M100芯片是“心脏”,提供算力支撑;全车感知系统是“眼睛”,实现精准三维感知及语义理解;自研马赫VLA模型是“大脑”,负责理解与决策。其中,语言智能由理想汽车自研的马赫Mind-Pro与马赫Mind-Edge承载,负责语言与逻辑思考,听懂指令、推演行动方案;全线控主动底盘系统和能源系统是手脚,将决策转化为物理世界的精准行动;自研星环OS是“神经系统”,为AI原生而生,实现“感知-决策-执行”全链路深度融合。
“具身智能,跟造车到底有什么关系?”李想解释称:“今天的传统智能汽车,并不是真的智能,本质上是‘功能驱动’,服务于特定场景,对安全的定义也是‘功能安全’。而真正的具身智能汽车,是一辆能够保护人类安全、独立完成任务、比人类更高效的汽车。这就是理想汽车的答案。过去十年,我们创造了一个移动的家。第二个十年,我们会给车和家,赋予生命。这就是我们这家公司存在的意义,也希望可以和所有人一起见证这个全新的时代!”
编辑:芯智讯-浪客剑
|