查看: 461|回复: 1

争夺“机器人大脑界”的安卓，达摩院开源具身基座模型 [复制链接]

军衔等级：

注册：2007-12-10 点赞数

2461

电梯直达

1^# 大中小

发表于 2026-2-13 11:11:35 |只看该作者 |倒序浏览

具身智能领域开源动作不断，各家都希望成为“机器大脑”界的安卓。

2月10日，阿里巴巴达摩院发布具身智能大脑基础模型RynnBrain，并一次性开源了包括30B MoE在内的7个全系列模型。

达摩院表示，作为业界首个MoE架构的30B具身模型，其只需要3B的推理激活参数就能超越业界的72B模型效果。

达摩院称开源的RynnBrain首次让机器人拥有了时空记忆和空间推理能力，在16项具身开源评测榜单上刷新纪录（SOTA），超越谷歌Gemini Robotics ER 1.5等行业顶尖模型。

达摩院RynnBrain开源之前，包括蚂蚁集团旗下灵波科技的LingBot-VLA、智元机器人的GO-1等基座模型先后对外宣布开源。

此次开源，达摩院特地强调了当前具身智能的两个路线“动作模型”和“大脑模型”泛化能力不足的瓶颈。

“VLA模型往往因为数据稀缺难以实现泛化，”阿里巴巴发言人表示，“大脑模型普遍缺乏记忆力，动态认知受限且普遍存在物理幻觉。”

为了克服这些问题，达摩院的RynnBrain模型引入了时空记忆和物理世界推理，

前者可让机器人在其完整的历史记忆中定位物体、目标区域，甚至预测运动轨迹，从而赋予机器人全局时空回溯能力，后者可以确保推理过程紧密扎根于物理环境，减弱了幻觉问题。

达摩院具身智能实验室负责人赵德丽表示：“RynnBrain 首次实现了大脑对物理世界的深度理解与可靠规划。”

据达摩院提供的材料，基于RynnBrain模型的时空记忆，运行RynnBrain模型的机器人，在执行A任务中被突然打断要求先做B任务，它能记住A任务的时间和空间状态，等完成B后继续工作。

阿里巴巴透露，RynnBrain在Qwen3-VL基础上训练，使用自研的RynnScale架构进行训练优化，同等资源加速两倍，训练数据超过2000万对。

结果显示，RynnBrain能力全面，性能领先，在16项具身开源评测榜单上刷新纪录（SOTA），包括环境感知与对象推理、第一人称视觉问答、空间推理、轨迹预测等，超越了谷歌Gemini Robotics ER 1.5、英伟达 Cosmos Reason 2等具身顶尖模型。

达摩院在对外的资料中强调，RynnBrain还拥有良好的可拓展性，能够快速地训练出导航、规划、动作等多种具身模型。

以具身规划模型为例，其需要强大预测能力和场景解析能力，但基于RynnBrain为基础，只需几百条数据微调，效果就能超越Gemini 3 Pro。

本帖有 1 个回帖，您需要登录后才能浏览登录 | 注册

GMT+8, 2026-2-14 06:45 , Processed in 0.101620 second(s), 16 queries , Gzip On.

		自动登录	找回密码
密码			注册