苹果推出300亿参数MM1多模态AI大模型 [复制链接]

gythy1978

军衔等级：

上校

电梯直达

1^# 大中小

发表于 2024-3-18 13:06:21 |只看该作者 |倒序浏览

苹果公司最新发布了一款名为MM1的多模态大模型，该模型提供30亿、70亿和300亿三种参数规模，并拥有图像识别和自然语言推理能力。这款模型是在苹果研究团队的主导下开发的，并在各种变量控制实验中取得了令人满意的结果。研究表明，图像分辨率和图像标记数量对模型性能影响较大，而视觉语言连接器则对模型的影响较小。此外，不同类型的数据集对模型的性能也有不同的影响。研究人员首先进行了小规模消融实验，在模型架构决策和预训练数据上进行了探索。随后，他们构建了一种名为Top-2 Gating的混合专家架构，并结合了“MM1”名称命名这个新模型。

本主题由版主或管理员于 2024-3-18 13:06 审核通过

0 举报本楼

本帖有 1 个回帖，您需要登录后才能浏览登录 | 注册

返回列表

手机版|C114 ( 沪ICP备12002291号-1 )|联系我们 |网站地图

GMT+8, 2024-5-3 11:33 , Processed in 0.084130 second(s), 16 queries , Gzip On.

Discuz Licensed

回顶部

		自动登录	找回密码
密码			注册