通信人家园

标题: 交流:华为时候能跟上VLA技术方向  [查看完整版帖子] [打印本页]

时间:  2026-1-21 11:47
作者: 奋斗士     标题: 交流:华为时候能跟上VLA技术方向

近日,腾讯汽车获悉,DeepSeek核心研究员阮翀已正式加盟自动驾驶公司元戎启行。这一消息从多个独立信源得到证实。


业内人士认为,从研究背景看,阮翀的加入或将加速元戎启行在 VLA 大模型领域的技术突破。


3年前,Wayve全球首发了VLA智驾(小米挖的陈龙就是这公司的),
去年8月,理想首发国内首个VLA智驾,
去年9月,小鹏首发国内首个基于自研3000TOPS芯片的VLA智驾,
今年,极氪、长城也陆续发布VLA智驾,零跑VLA智驾也发布了规划路标,
英伟达最近开源了VLA开发、测试工具包,
。。。


不知华为什么时候转到这个技术路线、跟上行业发展?

时间:  2026-1-21 14:33
作者: 快乐的小2b

华为在智驾领域一直有技术储备,VLA只是实现方式之一,关键要看实际落地效果。
时间:  2026-1-21 15:28
作者: 客家人

   菊花智驾说白了就是高精地图+规则
   菊花不擅长大模型,例如盘古搞的一地鸡毛
时间:  2026-1-21 15:58
作者: Desla的马甲

客家人 发表于 2026-1-21 15:28
菊花智驾说白了就是高精地图+规则
   菊花不擅长大模型,例如盘古搞的一地鸡毛

客总,啥年代了还在提高精地图?你貌似根本没搞懂WA的基本逻辑。正因为WA对大模型自学能力和算法水平要求太高,所以,现在也就特斯拉和华为搞得有模样,当然蔚来也在后面跟着。
到客总嘴里居然变成了高精地图和规则,我是以为回到10年前了呢。
时间:  2026-1-21 16:09
作者: Desla的马甲

我的看法是这两种智驾既不是非此即彼,也没有绝对好坏。需要根据不同应用场景和阶段组合应用。但同时搞聚焦两套模式成本确实太高,厂家必然只能集中搞一个,但也不是完全放弃另一个。特斯拉就是WA和VLA一起搞,WA为核心,辅以VLA。
VLA开发了应用版本的周期短,适合起步晚,又需要快速起步的企业,但在一些极端场景的覆盖存在盲区,又因为增加了一个V—L,L—A的两次翻译,响应速度肯定要比WA慢。

所以VLA短期容易出效果,适合版本快速迭代场景,长期来看WA积累足够多数据,自学积累更快,WA更能处理更复杂的组合场景。但可能都不能完全取代彼此。或者后续会有比VLA和WA更高维的技术替代两者。
时间:  2026-1-21 16:22
作者: 客家人

Desla的马甲 发表于 2026-1-21 16:09
我的看法是这两种智驾既不是非此即彼,也没有绝对好坏。需要根据不同应用场景和阶段组合应用。但同时搞聚焦 ...

   别吹了,你去看菊花智驾,抖音故障视频一天能刷到上十个,我就纳闷,为啥去年刷不到?看来是经费砍了,据说菊司今年招待费砍了90%
时间:  2026-1-21 16:26
作者: Desla的马甲

从技术本质来看,WA比VLA更符合人类驾驶模式。人在开车的时候,可不会每次要做啥动作还要先在脑子里用户语言表达一下动作,该刹车加油就直接上脚,该转弯就直接上手。甚至有些超车或刹车的判断都不是靠理论公式计算,而是靠经验,条件反射或直觉。这些很难用语言来呈现。另外,按照信息漏斗理论,多一次翻译就多一次信息失真,VLA翻译两次,肯定比WA翻译一次的失真大。
VLA的最大优点是能及时呈现车辆动作的逻辑,让坐车的人及时了解驾驶情况。但如果到了L4和L5,这点优点就不那么明显了。
时间:  2026-1-21 16:30
作者: Desla的马甲

客家人 发表于 2026-1-21 16:22
别吹了,你去看菊花智驾,抖音故障视频一天能刷到上十个,我就纳闷,为啥去年刷不到?看来是经费砍了, ...

客总,你自己都说信息茧房,你这天天被这些菊司负面信息包围,不觉得这茧房把你包得很紧实么?
话说客总天天看菊司这些负面信息,居然没认为菊司马上就要噶了,这是不是说明客总对菊司的未来还是很乐观?哈哈。
时间:  2026-1-21 16:35
作者: Desla的马甲

客家人 发表于 2026-1-21 16:22
别吹了,你去看菊花智驾,抖音故障视频一天能刷到上十个,我就纳闷,为啥去年刷不到?看来是经费砍了, ...

而且,我是纳闷了,按客总看来的菊司这么差的智驾,怎么公开渠道的各种智驾水平排名,菊司基本都在第一梯队呢。关键是奥迪居然也用鸿蒙ADS。用这么烂的智驾,奥迪是要自寻死路么?哈哈。客总到底谁在信息茧房里呢?
时间:  2026-1-21 16:43
作者: Vladimir_lenin

Desla的马甲 发表于 2026-1-21 16:35
而且,我是纳闷了,按客总看来的菊司这么差的智驾,怎么公开渠道的各种智驾水平排名,菊司基本都在第一梯 ...

又编造神话了···
什么媒体什么报道,什么水平智驾排名里,排名多少?什么品牌?

时间:  2026-1-21 16:51
作者: Desla的马甲

本帖最后由 Desla的马甲 于 2026-1-21 16:52 编辑

对一些眼盲心盲的人,看不到太正常了。看不到就看不到吧,自己还不会去搜,去AI问问去,叫不醒装睡的人。
时间:  2026-1-21 16:54
作者: 奋斗士

Desla的马甲 发表于 2026-1-21 15:58
客总,啥年代了还在提高精地图?你貌似根本没搞懂WA的基本逻辑。正因为WA对大模型自学能力和算法水平要求 ...

这地方半年前有个闸机,菊花车到了这里后:车机显示有闸机,车开始自动减速!

这不是地图方案是什么?根据车里没有及时更新的老旧高精地图在开车,而不是根据实时路况在开车


闸机减速.jpg


附件: 闸机减速.jpg (2026-1-21 16:52, 213.03 KB) / 下载次数 0
https://www.txrjy.com/forum.php?mod=attachment&aid=NzEzOTI4fGJhMjVkNWFmfDE3NjkwMTIzOTJ8MHww
时间:  2026-1-21 17:18
作者: 奋斗士

Desla的马甲 发表于 2026-1-21 16:26
从技术本质来看,WA比VLA更符合人类驾驶模式。人在开车的时候,可不会每次要做啥动作还要先在脑子里用户语言 ...

你对VLA的理解是错的:VLA机制见下图!
你对WA的理解是错的:主要是训练用,模拟一些真实路况没遇过的场景,不是车上本地推理用!

VLA让车、机器人。。。具备本地的快速的推理能力!

VLA架构.jpg





附件: VLA架构.jpg (2026-1-21 17:09, 73.64 KB) / 下载次数 0
https://www.txrjy.com/forum.php?mod=attachment&aid=NzEzOTMxfDdjOGEwZWEyfDE3NjkwMTIzOTJ8MHww
时间:  2026-1-21 17:47
作者: Desla的马甲

奋斗士 发表于 2026-1-21 17:18
你对VLA的理解是错的:VLA机制见下图!
你对WA的理解是错的:主要是训练用,模拟一些真实路况没遇过的场 ...

如果VLA是这个定义,那不就是VLA+WA的架构了么。你这图更佐证我认为两者不是谁取代谁,而是相互配合的观点。
VLA(视觉-语言-动作模型)和世界模型是人工智能领域,尤其是具身智能和自动驾驶方向的两种重要技术路线,它们既有区别又有联系,具体关系如下:

区别
核心功能
VLA:核心是将视觉感知、语言理解与动作生成整合到一个统一的模型中,实现从视觉输入到动作输出的端到端映射,侧重于对环境的语义理解以及基于语言指令的动作生成。
世界模型:核心是在系统内部构建对物理环境的动态模拟器,通过学习环境的动态规律,预测未来可能发生的场景,侧重于对环境状态和动态规律的建模与预测。
技术逻辑
VLA:遵循“感知-理解-决策-控制”的全链路语义化转化,通过图像传感器获取环境信息,转化为语言token,再由大模型生成驾驶建议,最后转化为车辆控制轨迹。
世界模型:绕开语言转化环节,直接将3D高斯表征、点云等空间感知数据输入大模型,在模型潜空间内完成物理规律推演,并直接输出车辆控制指令。
优势场景
VLA:擅长处理复杂的语义理解任务,如识别模糊或未标注场景、理解自然语言指令等,在城市复杂路况和突发人文场景中表现较好。
世界模型:在高速、封闭道路等场景中,对长距离路径规划与风险预判更具优势,能更好地处理环境动态变化和复杂物理规律。
联系
互补关系:VLA在语义理解与高层策略生成方面具有优势,世界模型在物理预测与未来情景推演方面能力突出。两者结合可以形成“语义理解”与“物理预测”的互补组合,提升系统的整体性能。
融合趋势:在实际应用中,越来越多的研究和实践开始探索VLA与世界模型的融合。例如,将世界模型的预测能力嵌入到VLA的训练目标中,或者设计能够同时涵盖视觉、语言、动作与动态预测的融合模型,使系统既具备良好的场景理解和动作规划能力,又能预测未来状态。
技术基础相似:两者都基于深度学习技术,尤其是Transformer架构,在模型设计和训练方法上存在一定的相似性,都依赖大量的数据和计算资源进行训练。
时间:  2026-1-21 17:53
作者: Desla的马甲

奋斗士 发表于 2026-1-21 16:54
这地方半年前有个闸机,菊花车到了这里后:车机显示有闸机,车开始自动减速!

这不是地图方案是什么? ...

所有的智驾车都有地图,但有地图,就是靠地图智驾?这得多脑抽的人才能这么想。
如果这就说明ADS就是靠地图,我看特斯拉也要遭殃,只有一叶障目的人才会相信。
时间:  2026-1-21 18:11
作者: 奋斗士

Desla的马甲 发表于 2026-1-21 17:53
所有的智驾车都有地图,但有地图,就是靠地图智驾?这得多脑抽的人才能这么想。
如果这就说明ADS就是靠地 ...

一个空地,
显示半年前的闸机,
在这个时光闸机前自动减速,这还不够实锤?
时间:  2026-1-21 18:13
作者: 看看夕阳

奋斗士 发表于 2026-1-21 16:54
这地方半年前有个闸机,菊花车到了这里后:车机显示有闸机,车开始自动减速!

这不是地图方案是什么? ...

这太假了吧,如果真是只有这样能力,谁还会合作自动驾驶,造谣抹黑太无耻。
时间:  2026-1-21 18:16
作者: Desla的马甲

本帖最后由 Desla的马甲 于 2026-1-21 18:18 编辑
奋斗士 发表于 2026-1-21 18:11
一个空地,
显示半年前的闸机,
在这个时光闸机前自动减速,这还不够实锤?


先不说这个是否真实,凭这个信息就推断ADS用的高精地图?你跟客总一样的智商水平么?
人家客总智商本身可不低,只是面对菊司,被仇恨拉低了智商,你要是不仇恨菊司,那智商本就这么低么?那我还是相信你跟客总一样,是因为恨菊司。
时间:  2026-1-21 18:21
作者: 客家人

奋斗士 发表于 2026-1-21 18:11
一个空地,
显示半年前的闸机,
在这个时光闸机前自动减速,这还不够实锤?

    100%是高精地图,好多车主反映,例如一条十字路口划线改了,每次都走错。
    这个不难理解,菊花造车还是延续以前的思路。
    先吹牛逼,收割粉丝,再快速迭代
    例如2022款问界M7后防撞钢梁是塑料的
时间:  2026-1-21 18:23
作者: 客家人

奋斗士 发表于 2026-1-21 18:11
一个空地,
显示半年前的闸机,
在这个时光闸机前自动减速,这还不够实锤?

    100%是高精地图,好多车主反映,例如一条十字路口划线改了,每次都走错。
    这个不难理解,菊花造车还是延续以前的思路。
    先吹牛逼,收割粉丝,再快速迭代
    例如2022款问界M7后防撞钢梁是塑料的
时间:  2026-1-21 18:24
作者: 奋斗士

本帖最后由 奋斗士 于 2026-1-21 20:40 编辑
Desla的马甲 发表于 2026-1-21 17:53
所有的智驾车都有地图,但有地图,就是靠地图智驾?这得多脑抽的人才能这么想。
如果这就说明ADS就是靠地 ...

如果你认为上面时光闸机还不能证明菊花是高精地图方案,那么,
下面的菊花泊车代驾和百度2019年无人泊车,都只能在特定的合作停车场才可用,这不就是典型高精地图吗?因为需求提前扫好停车场的高精地图!


理想基于VLA的无人泊车,可以针对任意停车场,实时生成3D建模!在任意停车场使用!

1)百度2019年的无人泊车,只能在特定合作停车场使用,因为需要提前采集停车场的高精地图!
停车场 百度.jpg


2)菊花代客泊车,也是只能在特定停车场用 停车场 百度.jpg

3)理想,针对任意停车场,可以实时3D建模,停3D图里的任意位置!
停车场 理想.jpg




附件: 停车场 百度.jpg (2026-1-21 18:18, 131.65 KB) / 下载次数 0
https://www.txrjy.com/forum.php?mod=attachment&aid=NzEzOTM3fGNmZDkzZmY5fDE3NjkwMTIzOTJ8MHww

附件: 停车场 百度.jpg (2026-1-21 18:18, 231.66 KB) / 下载次数 0
https://www.txrjy.com/forum.php?mod=attachment&aid=NzEzOTM4fDg5MjJmZTI0fDE3NjkwMTIzOTJ8MHww

附件: 停车场 理想.jpg (2026-1-21 18:23, 223 KB) / 下载次数 0
https://www.txrjy.com/forum.php?mod=attachment&aid=NzEzOTM5fGQwNzQ1MjBlfDE3NjkwMTIzOTJ8MHww
时间:  2026-1-21 18:28
作者: 奋斗士

看看夕阳 发表于 2026-1-21 18:13
这太假了吧,如果真是只有这样能力,谁还会合作自动驾驶,造谣抹黑太无耻。

菊花比传统车企还是强那么一丁点,尤其是传统小车企,

现在传统大车企,都在做VLA的自研方案了
时间:  2026-1-21 19:24
作者: h68810115

Desla的马甲 发表于 2026-1-21 17:47
如果VLA是这个定义,那不就是VLA+WA的架构了么。你这图更佐证我认为两者不是谁取代谁,而是相互配合的观点 ...

让人家赢不就得了
时间:  2026-1-21 19:45
作者: 客家人

h68810115 发表于 2026-1-21 19:24
让人家赢不就得了

    吹牛逼总有暴露的那一天
    最近界车智驾问题视频越来越多
时间:  2026-1-21 19:46
作者: 客家人

奋斗士 发表于 2026-1-21 18:28
菊花比传统车企还是强那么一丁点,尤其是传统小车企,

现在传统大车企,都在做VLA的自研方案了

     小米智驾进步很快,最新OTA的版本已经很好用
时间:  2026-1-21 21:34
作者: Desla的马甲

本帖最后由 Desla的马甲 于 2026-1-21 21:34 编辑
奋斗士 发表于 2026-1-21 18:24
如果你认为上面时光闸机还不能证明菊花是高精地图方案,那么,
下面的菊花泊车代驾和百度2019年无人泊车 ...


如果你还是坚持认为ADS是高精地图方案。那我也只能认为你智商跟客总一样了。智驾行业内谁都不敢这么说,你跟客总这么肯定,那你两的智商水平在菊司的事情上确实差不多。
时间:  2026-1-21 22:03
作者: 奋斗士

本帖最后由 奋斗士 于 2026-1-21 22:20 编辑
Desla的马甲 发表于 2026-1-21 21:34
如果你还是坚持认为ADS是高精地图方案。那我也只能认为你智商跟客总一样了。智驾行业内谁都不敢这么说, ...

上面停车场能力,都是企业的官方宣传:

理想VLA能对任意停车场自动实时生成3D建模,能在任意停车场代客泊车,

华为代客泊车只能在特定合作的停车场 >>> 你认为:这车的车端AI具备智能?

限定停车场,说明华为车和百度2019的方案一样:不能自己实时建图,这不就说明了华为车:依赖事先保存在车端的外部地图吗?

这种依赖事先保存在车端的外部地图模式,高精地图方案不就是:车是根据预先保存的地图来规划决策路线,而不是根据摄像头看到的实时路况来规划路线吗?如果你认为这不是高精地图方案,那你认为是什么?

时间:  2026-1-21 22:29
作者: 看看夕阳

客家人 发表于 2026-1-21 19:45
吹牛逼总有暴露的那一天
    最近界车智驾问题视频越来越多

你贡献多少,有几段是你搞的吧
时间:  2026-1-21 22:30
作者: 看看夕阳

客家人 发表于 2026-1-21 19:46
小米智驾进步很快,最新OTA的版本已经很好用

你用了?




通信人家园 (https://www.txrjy.com/) Powered by C114