通信人家园

标题: 交流：华为时候能跟上VLA技术方向 [查看完整版帖子] [打印本页]

时间: 2026-1-21 11:47

作者: 奋斗士 标题: 交流：华为时候能跟上VLA技术方向

近日，腾讯汽车获悉，DeepSeek核心研究员阮翀已正式加盟自动驾驶公司元戎启行。这一消息从多个独立信源得到证实。

业内人士认为，从研究背景看，阮翀的加入或将加速元戎启行在 VLA 大模型领域的技术突破。

3年前，Wayve全球首发了VLA智驾（小米挖的陈龙就是这公司的），
去年8月，理想首发国内首个VLA智驾，
去年9月，小鹏首发国内首个基于自研3000TOPS芯片的VLA智驾，
今年，极氪、长城也陆续发布VLA智驾，零跑VLA智驾也发布了规划路标，
英伟达最近开源了VLA开发、测试工具包，
。。。

不知华为什么时候转到这个技术路线、跟上行业发展？

时间: 2026-1-21 14:33

作者: 快乐的小2b

华为在智驾领域一直有技术储备，VLA只是实现方式之一，关键要看实际落地效果。

时间: 2026-1-21 15:28

作者: 客家人

菊花智驾说白了就是高精地图+规则
菊花不擅长大模型，例如盘古搞的一地鸡毛

时间: 2026-1-21 15:58

作者: Desla的马甲

客家人发表于 2026-1-21 15:28
菊花智驾说白了就是高精地图+规则
菊花不擅长大模型，例如盘古搞的一地鸡毛

客总，啥年代了还在提高精地图？你貌似根本没搞懂WA的基本逻辑。正因为WA对大模型自学能力和算法水平要求太高，所以，现在也就特斯拉和华为搞得有模样，当然蔚来也在后面跟着。
到客总嘴里居然变成了高精地图和规则，我是以为回到10年前了呢。

时间: 2026-1-21 16:09

作者: Desla的马甲

我的看法是这两种智驾既不是非此即彼，也没有绝对好坏。需要根据不同应用场景和阶段组合应用。但同时搞聚焦两套模式成本确实太高，厂家必然只能集中搞一个，但也不是完全放弃另一个。特斯拉就是WA和VLA一起搞，WA为核心，辅以VLA。
VLA开发了应用版本的周期短，适合起步晚，又需要快速起步的企业，但在一些极端场景的覆盖存在盲区，又因为增加了一个V—L，L—A的两次翻译，响应速度肯定要比WA慢。

所以VLA短期容易出效果，适合版本快速迭代场景，长期来看WA积累足够多数据，自学积累更快，WA更能处理更复杂的组合场景。但可能都不能完全取代彼此。或者后续会有比VLA和WA更高维的技术替代两者。

时间: 2026-1-21 16:22

作者: 客家人

Desla的马甲发表于 2026-1-21 16:09
我的看法是这两种智驾既不是非此即彼，也没有绝对好坏。需要根据不同应用场景和阶段组合应用。但同时搞聚焦 ...

别吹了，你去看菊花智驾，抖音故障视频一天能刷到上十个，我就纳闷，为啥去年刷不到？看来是经费砍了，据说菊司今年招待费砍了90%

时间: 2026-1-21 16:26

作者: Desla的马甲

从技术本质来看，WA比VLA更符合人类驾驶模式。人在开车的时候，可不会每次要做啥动作还要先在脑子里用户语言表达一下动作，该刹车加油就直接上脚，该转弯就直接上手。甚至有些超车或刹车的判断都不是靠理论公式计算，而是靠经验，条件反射或直觉。这些很难用语言来呈现。另外，按照信息漏斗理论，多一次翻译就多一次信息失真，VLA翻译两次，肯定比WA翻译一次的失真大。
VLA的最大优点是能及时呈现车辆动作的逻辑，让坐车的人及时了解驾驶情况。但如果到了L4和L5，这点优点就不那么明显了。

时间: 2026-1-21 16:30

作者: Desla的马甲

客家人发表于 2026-1-21 16:22
别吹了，你去看菊花智驾，抖音故障视频一天能刷到上十个，我就纳闷，为啥去年刷不到？看来是经费砍了， ...

客总，你自己都说信息茧房，你这天天被这些菊司负面信息包围，不觉得这茧房把你包得很紧实么？
话说客总天天看菊司这些负面信息，居然没认为菊司马上就要噶了，这是不是说明客总对菊司的未来还是很乐观？哈哈。

时间: 2026-1-21 16:35

作者: Desla的马甲

客家人发表于 2026-1-21 16:22
别吹了，你去看菊花智驾，抖音故障视频一天能刷到上十个，我就纳闷，为啥去年刷不到？看来是经费砍了， ...

而且，我是纳闷了，按客总看来的菊司这么差的智驾，怎么公开渠道的各种智驾水平排名，菊司基本都在第一梯队呢。关键是奥迪居然也用鸿蒙ADS。用这么烂的智驾，奥迪是要自寻死路么？哈哈。客总到底谁在信息茧房里呢？

时间: 2026-1-21 16:43

作者: Vladimir_lenin

Desla的马甲发表于 2026-1-21 16:35
而且，我是纳闷了，按客总看来的菊司这么差的智驾，怎么公开渠道的各种智驾水平排名，菊司基本都在第一梯 ...

又编造神话了···
什么媒体什么报道，什么水平智驾排名里，排名多少？什么品牌？

时间: 2026-1-21 16:51

作者: Desla的马甲

本帖最后由 Desla的马甲于 2026-1-21 16:52 编辑

对一些眼盲心盲的人，看不到太正常了。看不到就看不到吧，自己还不会去搜，去AI问问去，叫不醒装睡的人。

时间: 2026-1-21 16:54

作者: 奋斗士

Desla的马甲发表于 2026-1-21 15:58
客总，啥年代了还在提高精地图？你貌似根本没搞懂WA的基本逻辑。正因为WA对大模型自学能力和算法水平要求 ...

这地方半年前有个闸机，菊花车到了这里后：车机显示有闸机，车开始自动减速！

这不是地图方案是什么？根据车里没有及时更新的老旧高精地图在开车，而不是根据实时路况在开车

闸机减速.jpg

附件: 闸机减速.jpg (2026-1-21 16:52, 213.03 KB) / 下载次数 0
https://www.txrjy.com/forum.php?mod=attachment&aid=NzEzOTI4fDA0ZTZkMWJlfDE3ODUxMDY2MjR8MHww

时间: 2026-1-21 17:18

作者: 奋斗士

Desla的马甲发表于 2026-1-21 16:26
从技术本质来看，WA比VLA更符合人类驾驶模式。人在开车的时候，可不会每次要做啥动作还要先在脑子里用户语言 ...

你对VLA的理解是错的：VLA机制见下图！
你对WA的理解是错的：主要是训练用，模拟一些真实路况没遇过的场景，不是车上本地推理用！

VLA让车、机器人。。。具备本地的快速的推理能力！

VLA架构.jpg

附件: VLA架构.jpg (2026-1-21 17:09, 73.64 KB) / 下载次数 0
https://www.txrjy.com/forum.php?mod=attachment&aid=NzEzOTMxfDUzZDU1M2JjfDE3ODUxMDY2MjR8MHww

时间: 2026-1-21 17:47

作者: Desla的马甲

奋斗士发表于 2026-1-21 17:18
你对VLA的理解是错的：VLA机制见下图！
你对WA的理解是错的：主要是训练用，模拟一些真实路况没遇过的场 ...

如果VLA是这个定义，那不就是VLA+WA的架构了么。你这图更佐证我认为两者不是谁取代谁，而是相互配合的观点。
VLA（视觉-语言-动作模型）和世界模型是人工智能领域，尤其是具身智能和自动驾驶方向的两种重要技术路线，它们既有区别又有联系，具体关系如下：

区别
核心功能
VLA：核心是将视觉感知、语言理解与动作生成整合到一个统一的模型中，实现从视觉输入到动作输出的端到端映射，侧重于对环境的语义理解以及基于语言指令的动作生成。
世界模型：核心是在系统内部构建对物理环境的动态模拟器，通过学习环境的动态规律，预测未来可能发生的场景，侧重于对环境状态和动态规律的建模与预测。
技术逻辑
VLA：遵循“感知-理解-决策-控制”的全链路语义化转化，通过图像传感器获取环境信息，转化为语言token，再由大模型生成驾驶建议，最后转化为车辆控制轨迹。
世界模型：绕开语言转化环节，直接将3D高斯表征、点云等空间感知数据输入大模型，在模型潜空间内完成物理规律推演，并直接输出车辆控制指令。
优势场景
VLA：擅长处理复杂的语义理解任务，如识别模糊或未标注场景、理解自然语言指令等，在城市复杂路况和突发人文场景中表现较好。
世界模型：在高速、封闭道路等场景中，对长距离路径规划与风险预判更具优势，能更好地处理环境动态变化和复杂物理规律。
联系
互补关系：VLA在语义理解与高层策略生成方面具有优势，世界模型在物理预测与未来情景推演方面能力突出。两者结合可以形成“语义理解”与“物理预测”的互补组合，提升系统的整体性能。
融合趋势：在实际应用中，越来越多的研究和实践开始探索VLA与世界模型的融合。例如，将世界模型的预测能力嵌入到VLA的训练目标中，或者设计能够同时涵盖视觉、语言、动作与动态预测的融合模型，使系统既具备良好的场景理解和动作规划能力，又能预测未来状态。
技术基础相似：两者都基于深度学习技术，尤其是Transformer架构，在模型设计和训练方法上存在一定的相似性，都依赖大量的数据和计算资源进行训练。

时间: 2026-1-21 17:53

作者: Desla的马甲

奋斗士发表于 2026-1-21 16:54
这地方半年前有个闸机，菊花车到了这里后：车机显示有闸机，车开始自动减速！

这不是地图方案是什么？ ...

所有的智驾车都有地图，但有地图，就是靠地图智驾？这得多脑抽的人才能这么想。
如果这就说明ADS就是靠地图，我看特斯拉也要遭殃，只有一叶障目的人才会相信。

时间: 2026-1-21 18:11

作者: 奋斗士

Desla的马甲发表于 2026-1-21 17:53
所有的智驾车都有地图，但有地图，就是靠地图智驾？这得多脑抽的人才能这么想。
如果这就说明ADS就是靠地 ...

一个空地，
显示半年前的闸机，
在这个时光闸机前自动减速，这还不够实锤？

时间: 2026-1-21 18:13

作者: 看看夕阳

奋斗士发表于 2026-1-21 16:54
这地方半年前有个闸机，菊花车到了这里后：车机显示有闸机，车开始自动减速！

这不是地图方案是什么？ ...

这太假了吧，如果真是只有这样能力，谁还会合作自动驾驶，造谣抹黑太无耻。

时间: 2026-1-21 18:16

作者: Desla的马甲

本帖最后由 Desla的马甲于 2026-1-21 18:18 编辑

奋斗士发表于 2026-1-21 18:11
一个空地，
显示半年前的闸机，
在这个时光闸机前自动减速，这还不够实锤？

先不说这个是否真实，凭这个信息就推断ADS用的高精地图？你跟客总一样的智商水平么？
人家客总智商本身可不低，只是面对菊司，被仇恨拉低了智商，你要是不仇恨菊司，那智商本就这么低么？那我还是相信你跟客总一样，是因为恨菊司。

时间: 2026-1-21 18:21

作者: 客家人

奋斗士发表于 2026-1-21 18:11
一个空地，
显示半年前的闸机，
在这个时光闸机前自动减速，这还不够实锤？

100%是高精地图，好多车主反映，例如一条十字路口划线改了，每次都走错。
这个不难理解，菊花造车还是延续以前的思路。
先吹牛逼，收割粉丝，再快速迭代
例如2022款问界M7后防撞钢梁是塑料的

时间: 2026-1-21 18:23

作者: 客家人

奋斗士发表于 2026-1-21 18:11
一个空地，
显示半年前的闸机，
在这个时光闸机前自动减速，这还不够实锤？

时间: 2026-1-21 18:24

作者: 奋斗士

本帖最后由奋斗士于 2026-1-21 20:40 编辑

Desla的马甲发表于 2026-1-21 17:53
所有的智驾车都有地图，但有地图，就是靠地图智驾？这得多脑抽的人才能这么想。
如果这就说明ADS就是靠地 ...

如果你认为上面时光闸机还不能证明菊花是高精地图方案，那么，
下面的菊花泊车代驾和百度2019年无人泊车，都只能在特定的合作停车场才可用，这不就是典型高精地图吗？因为需求提前扫好停车场的高精地图！

理想基于VLA的无人泊车，可以针对任意停车场，实时生成3D建模！在任意停车场使用！

1）百度2019年的无人泊车，只能在特定合作停车场使用，因为需要提前采集停车场的高精地图！
停车场百度.jpg

2）菊花代客泊车，也是只能在特定停车场用 停车场百度.jpg

3）理想，针对任意停车场，可以实时3D建模，停3D图里的任意位置！
停车场理想.jpg

附件: 停车场百度.jpg (2026-1-21 18:18, 131.65 KB) / 下载次数 0
https://www.txrjy.com/forum.php?mod=attachment&aid=NzEzOTM3fDZhNTA2YzVlfDE3ODUxMDY2MjR8MHww

附件: 停车场百度.jpg (2026-1-21 18:18, 231.66 KB) / 下载次数 0
https://www.txrjy.com/forum.php?mod=attachment&aid=NzEzOTM4fDMxMTZmY2VmfDE3ODUxMDY2MjR8MHww

附件: 停车场理想.jpg (2026-1-21 18:23, 223 KB) / 下载次数 0
https://www.txrjy.com/forum.php?mod=attachment&aid=NzEzOTM5fDU0NmI0ZWRkfDE3ODUxMDY2MjR8MHww

时间: 2026-1-21 18:28

作者: 奋斗士

看看夕阳发表于 2026-1-21 18:13
这太假了吧，如果真是只有这样能力，谁还会合作自动驾驶，造谣抹黑太无耻。

菊花比传统车企还是强那么一丁点，尤其是传统小车企，

现在传统大车企，都在做VLA的自研方案了

时间: 2026-1-21 19:24

作者: h68810115

Desla的马甲发表于 2026-1-21 17:47
如果VLA是这个定义，那不就是VLA+WA的架构了么。你这图更佐证我认为两者不是谁取代谁，而是相互配合的观点 ...

让人家赢不就得了

时间: 2026-1-21 19:45

作者: 客家人

h68810115 发表于 2026-1-21 19:24
让人家赢不就得了

吹牛逼总有暴露的那一天
最近界车智驾问题视频越来越多

时间: 2026-1-21 19:46

作者: 客家人

奋斗士发表于 2026-1-21 18:28
菊花比传统车企还是强那么一丁点，尤其是传统小车企，

现在传统大车企，都在做VLA的自研方案了

小米智驾进步很快，最新OTA的版本已经很好用

时间: 2026-1-21 21:34

作者: Desla的马甲

本帖最后由 Desla的马甲于 2026-1-21 21:34 编辑

奋斗士发表于 2026-1-21 18:24
如果你认为上面时光闸机还不能证明菊花是高精地图方案，那么，
下面的菊花泊车代驾和百度2019年无人泊车 ...

如果你还是坚持认为ADS是高精地图方案。那我也只能认为你智商跟客总一样了。智驾行业内谁都不敢这么说，你跟客总这么肯定，那你两的智商水平在菊司的事情上确实差不多。

时间: 2026-1-21 22:03

作者: 奋斗士

本帖最后由奋斗士于 2026-1-22 21:15 编辑

Desla的马甲发表于 2026-1-21 21:34
如果你还是坚持认为ADS是高精地图方案。那我也只能认为你智商跟客总一样了。智驾行业内谁都不敢这么说， ...

上面停车场能力，都是企业的官方宣传：

理想VLA能对任意停车场自动实时生成3D建模，能在任意停车场代客泊车，

华为代客泊车只能在特定合作的停车场 >>> 你认为：这车的车端AI具备智能？

限定停车场，说明华为车和百度2019的方案一样：不能自己实时建图，这不就说明了华为车：依赖事先保存在车端的外部地图吗？

这种依赖事先保存在车端的外部地图模式，高精地图方案不就是：车是根据预先保存的地图来规划决策路线，而不是根据摄像头看到的实时路况来规划路线吗？如果你认为这不是高精地图方案，那你认为是什么？

时间: 2026-1-21 22:29

作者: 看看夕阳

客家人发表于 2026-1-21 19:45
吹牛逼总有暴露的那一天
最近界车智驾问题视频越来越多

你贡献多少，有几段是你搞的吧

时间: 2026-1-21 22:30

作者: 看看夕阳

客家人发表于 2026-1-21 19:46
小米智驾进步很快，最新OTA的版本已经很好用

你用了？

时间: 2026-1-22 11:53

作者: lovexioy

看看夕阳发表于 2026-1-21 22:30
你用了？

客总用嘴

时间: 2026-1-22 11:59

作者: h68810115

本帖最后由 h68810115 于 2026-1-22 12:11 编辑

lovexioy 发表于 2026-1-22 11:53
客总用嘴

客总很聪明的，哪可能以身涉险啊，他是那个年代的大专生。
为粮司摇旗可以，呐喊也可以，不要说可能变热的凉车了，连不涉及安全的手机也不会用。

时间: 2026-1-22 12:03

作者: h68810115

flixyw 发表于 2026-1-22 11:56
你这琼B买得起粗粮？

客总不琼，是聪明，琼的是浆糊脑袋，和老婆几千块的还到网上说

时间: 2026-1-25 10:48

作者: rgjinxuan

华为在好多领域落后了估计没什么进取心了找个工程师要6 面

时间: 2026-1-25 11:33

作者: 客家人

h68810115 发表于 2026-1-22 11:59
客总很聪明的，哪可能以身涉险啊，他是那个年代的大专生。
为粮司摇旗可以，呐喊也可以，不要说可能变 ...

高中考的中专生，含金量很高

时间: 2026-1-25 12:32

作者: h68810115

客家人发表于 2026-1-25 11:33
高中考的中专生，含金量很高

客总别谦虚

时间: 2026-1-25 13:18

作者: Desla的马甲

rgjinxuan 发表于 2026-1-25 10:48
华为在好多领域落后了估计没什么进取心了找个工程师要6 面

怎么能是估计啊？自信点，要黑，就要黑得到位。

时间: 2026-1-26 00:07

作者: 客家人

奋斗士发表于 2026-1-21 22:03
上面停车场能力，都是企业的官方宣传：

理想VLA能对任意停车场自动实时生成3D建模，能在任意停车场代客 ...

看来吹的遥遥领先智驾
也就是扫地机器人，靠的是高精地图，然后靠激光雷达扫描物体，写规则。

时间: 2026-1-26 08:44

作者: zyq1972

客家人发表于 2026-1-21 15:28
菊花智驾说白了就是高精地图+规则
菊花不擅长大模型，例如盘古搞的一地鸡毛

毛都不懂，还乱喷

时间: 2026-1-26 08:52

作者: xiaoxiaohe99

名字不一样吧？

时间: 2026-1-26 11:16

作者: Danny_qd1978

汽车智驾通过传感器识别，算法渲染显示，还缺少一道传感器验证的环节（例如：4D雷达），造成渲染失真。

时间: 2026-1-26 11:39

作者: 奋斗士

Danny_qd1978 发表于 2026-1-26 11:16
汽车智驾通过传感器识别，算法渲染显示，还缺少一道传感器验证的环节（例如：4D雷达），造成渲染失真。

车机显示画面和路上情况不一样，很常见，车机里的周边人、车都是经常突然出现、突然消失。。。这些显示图标的变化，并不会影响智驾的开车行为

但是，前面那个案例是：在一个半年前拆掉闸机的位置，车机显示出闸机，然后车同时减速，这个和上面的情况并不一样。。。这个过程里，车的智驾行为是发生了变化，真的认为那里有个闸机

时间: 2026-1-30 01:31

作者: Desla的马甲

奋斗士发表于 2026-1-26 11:39
车机显示画面和路上情况不一样，很常见，车机里的周边人、车都是经常突然出现、突然消失。。。这些显示图 ...

前段时间现代汽车内部搞了个智驾测试。除了现代自己的智驾，还包括特斯拉，华为，momenta，mobilyeye。测试结果是特斯拉第一，华为第二，mibilyeye和momenta并列第三，现代排最后。
那可是在韩国测试的，华为总不能去韩国搞高精地图吧？

时间: 2026-1-30 09:23

作者: 奋斗士

Desla的马甲发表于 2026-1-30 01:31
前段时间现代汽车内部搞了个智驾测试。除了现代自己的智驾，还包括特斯拉，华为，momenta，mobilyeye。测 ...

公开新闻链接发出来看看

时间: 2026-1-30 10:15

作者: Desla的马甲

奋斗士发表于 2026-1-30 09:23
公开新闻链接发出来看看

https://www.thelec.net/news/articleView.html?idxno=5561

附件: screenshot_20260130_011723.jpg (2026-1-30 10:15, 175.04 KB) / 下载次数 0
https://www.txrjy.com/forum.php?mod=attachment&aid=NzE0NzA3fDkzMGNiZWJifDE3ODUxMDY2MjR8MHww

时间: 2026-1-30 10:24

作者: Desla的马甲

奋斗士发表于 2026-1-30 09:23
公开新闻链接发出来看看

其实一搜现代汽车智驾内部测试就能搜到了。

https://view.inews.qq.com/a/20260129V05PVW00?chlid=news_news_top&suid=8QMd3Hdf7YQd&uid=3292001&cur_vid=b3189svi2og

附件: screenshot_20260130_011723.jpg (2026-1-30 10:24, 175.04 KB) / 下载次数 0
https://www.txrjy.com/forum.php?mod=attachment&aid=NzE0NzE0fDQ4OGE5NDI1fDE3ODUxMDY2MjR8MHww

时间: 2026-1-30 10:32

作者: Desla的马甲

奋斗士发表于 2026-1-30 09:23
公开新闻链接发出来看看

链接发了好几次都发不出来。图都发不出来，搞不明白。你可以搜现代汽车智驾内部测试。
也可以点我都像看我的第一个主题贴，这贴给我移动到通信步行街去了。

通信人家园 (https://www.txrjy.com/)