通信人家园

 找回密码
 注册

只需一步,快速开始

短信验证,便捷登录

搜索

军衔等级:

  上校

注册:2015-1-2848
跳转到指定楼层
1#
发表于 2024-3-18 13:06:21 |只看该作者 |倒序浏览
苹果公司最新发布了一款名为MM1的多模态大模型,该模型提供30亿、70亿和300亿三种参数规模,并拥有图像识别和自然语言推理能力。这款模型是在苹果研究团队的主导下开发的,并在各种变量控制实验中取得了令人满意的结果。研究表明,图像分辨率和图像标记数量对模型性能影响较大,而视觉语言连接器则对模型的影响较小。此外,不同类型的数据集对模型的性能也有不同的影响。研究人员首先进行了小规模消融实验,在模型架构决策和预训练数据上进行了探索。随后,他们构建了一种名为Top-2 Gating的混合专家架构,并结合了“MM1”名称命名这个新模型。


举报本楼

本帖有 1 个回帖,您需要登录后才能浏览 登录 | 注册
您需要登录后才可以回帖 登录 | 注册 |

手机版|C114 ( 沪ICP备12002291号-1 )|联系我们 |网站地图  

GMT+8, 2024-5-3 11:33 , Processed in 0.084130 second(s), 16 queries , Gzip On.

Copyright © 1999-2023 C114 All Rights Reserved

Discuz Licensed

回顶部