通信人家园

 找回密码
 注册

只需一步,快速开始

短信验证,便捷登录

搜索

军衔等级:

  上校

注册:2020-6-2257
跳转到指定楼层
1#
发表于 2025-7-12 22:11:41 |只看该作者 |倒序浏览
本帖最后由 huaweizhongxing 于 2025-7-12 22:12 编辑

亚马逊联姻 DeepSeek 与通义千问:开启人形机器人 AI 操控新时代!













在全球人工智能与机器人技术的激烈竞争中,电商巨头亚马逊正以颠覆性姿态改写行业规则。6 月 6 日消息显示,亚马逊硬件研发核心部门 Lab126 已组建Agentic AI(代理式人工智能)团队,通过集成中国开源大语言模型DeepSeek-R1和阿里通义千问 Qwen2-VL-72B,全力推进 ** 物理 AI(Physical AI)** 研发,目标打造可通过自然语言指令自主执行复杂任务的人形机器人。


一、技术联姻:开源大模型重构机器人操控范式


亚马逊此次选择的DeepSeek-R1和通义千问 Qwen2-VL-72B,代表了当前开源模型的顶尖水平:




  • DeepSeek-R1:通过强化学习实现零样本推理,在数学、代码生成等任务上性能比肩 OpenAI o1 正式版,其开源特性允许亚马逊快速迭代模型。2025 年 1 月,亚马逊已将该模型接入 AWS 云服务,为机器人开发提供底层算力支持。
  • 通义千问 Qwen2-VL-72B:具备视觉智能体能力,可自主操作手机、机器人等设备,支持多语言文本理解和长视频分析,在文档处理和复杂决策场景中表现超越 GPT-4o。阿里此前已将该模型应用于钉钉 AI 客服助理,验证了其多模态交互能力。


这种语言模型 + 视觉智能体的组合,使机器人能通过自然语言指令完成环境感知 - 路径规划 - 精准操作全流程。例如,用户只需说 “将货架第三层的红色包裹搬到分拣区”,机器人即可通过视觉识别定位目标,规划避障路径,并调整机械臂力度完成搬运。


三、行业影响:开启 AI 驱动的机器人军备竞赛



亚马逊的技术选择引发全球关注:




  • 开源生态的商业价值:通过接入 DeepSeek 和通义千问,亚马逊节省了数亿美元的模型研发成本,同时借助开源社区的持续优化保持技术领先。
  • 对竞争对手的降维打击:相比特斯拉 Optimus 依赖自研模型、波士顿动力专注硬件突破,亚马逊的开源模型 + 云服务模式更具成本优势。行业预测,其机器人部署成本可比传统方案降低 40%。
  • 伦理与安全挑战:多模态模型在复杂环境中的可靠性仍存争议。UC 伯克利研究显示,当前顶尖模型在多视图理解任务中的准确率仅为人类的 50%,亚马逊需通过强化学习 + 人工标注双重机制提升鲁棒性。



举报本楼

本帖有 1 个回帖,您需要登录后才能浏览 登录 | 注册
您需要登录后才可以回帖 登录 | 注册 |

版规|手机版|C114 ( 沪ICP备12002291号-1 )|联系我们 |网站地图  

GMT+8, 2025-7-14 09:59 , Processed in 0.111404 second(s), 16 queries , Gzip On.

Copyright © 1999-2023 C114 All Rights Reserved

Discuz Licensed

回顶部