通信人家园

 找回密码
 注册

只需一步,快速开始

短信验证,便捷登录

搜索

军衔等级:

  大元帅

注册:2007-12-102461
跳转到指定楼层
1#
发表于 2026-2-13 11:11:35 |只看该作者 |倒序浏览
具身智能领域开源动作不断,各家都希望成为“机器大脑”界的安卓。
2月10日,阿里巴巴达摩院发布具身智能大脑基础模型RynnBrain,并一次性开源了包括30B MoE在内的7个全系列模型。
达摩院表示,作为业界首个MoE架构的30B具身模型,其只需要3B的推理激活参数就能超越业界的72B模型效果。
达摩院称开源的RynnBrain首次让机器人拥有了时空记忆和空间推理能力,在16项具身开源评测榜单上刷新纪录(SOTA),超越谷歌Gemini Robotics ER 1.5等行业顶尖模型。
达摩院RynnBrain开源之前,包括蚂蚁集团旗下灵波科技的LingBot-VLA、智元机器人的GO-1等基座模型先后对外宣布开源。
此次开源,达摩院特地强调了当前具身智能的两个路线“动作模型”和“大脑模型”泛化能力不足的瓶颈。
“VLA模型往往因为数据稀缺难以实现泛化,”阿里巴巴发言人表示,“大脑模型普遍缺乏记忆力,动态认知受限且普遍存在物理幻觉。”
为了克服这些问题,达摩院的RynnBrain模型引入了时空记忆和物理世界推理,
前者可让机器人在其完整的历史记忆中定位物体、目标区域,甚至预测运动轨迹,从而赋予机器人全局时空回溯能力,后者可以确保推理过程紧密扎根于物理环境,减弱了幻觉问题。
达摩院具身智能实验室负责人赵德丽表示:“RynnBrain 首次实现了大脑对物理世界的深度理解与可靠规划。”
据达摩院提供的材料,基于RynnBrain模型的时空记忆,运行RynnBrain模型的机器人,在执行A任务中被突然打断要求先做B任务,它能记住A任务的时间和空间状态,等完成B后继续工作。
阿里巴巴透露,RynnBrain在Qwen3-VL基础上训练,使用自研的RynnScale架构进行训练优化,同等资源加速两倍,训练数据超过2000万对。
结果显示,RynnBrain能力全面,性能领先,在16项具身开源评测榜单上刷新纪录(SOTA),包括环境感知与对象推理、第一人称视觉问答、空间推理、轨迹预测等,超越了谷歌Gemini Robotics ER 1.5、英伟达 Cosmos Reason 2等具身顶尖模型。
达摩院在对外的资料中强调,RynnBrain还拥有良好的可拓展性,能够快速地训练出导航、规划、动作等多种具身模型。
以具身规划模型为例,其需要强大预测能力和场景解析能力,但基于RynnBrain为基础,只需几百条数据微调,效果就能超越Gemini 3 Pro。

举报本楼

本帖有 1 个回帖,您需要登录后才能浏览 登录 | 注册
您需要登录后才可以回帖 登录 | 注册 |

版规|手机版|C114 ( 沪ICP备12002291号-1 )|联系我们 |网站地图  

GMT+8, 2026-2-14 06:45 , Processed in 0.101620 second(s), 16 queries , Gzip On.

Copyright © 1999-2025 C114 All Rights Reserved

Discuz Licensed

回顶部