查看: 471|回复: 4

小米发布全新旗舰开源模型 [复制链接]

coffee198375

军衔等级：

大元帅

注册：2007-12-10 点赞数

2340

电梯直达

1^# 大中小

发表于 2025-12-17 10:40:02 |只看该作者 |倒序浏览

12月16日消息，小米正式发布并向全球开源新一代基础语言模型MiMo‑V2‑Flash。

这是小米在大模型领域迄今为止最重要的一次技术发布之一。该模型已在发布当日同步上线Hugging Face、API Platform 和AI Studio三大平台，面向全球开发者与普通用户开放使用。

作为小米的旗舰级基础语言模型，MiMo‑V2‑Flash主打“高性能、低成本和超高速度”。小米方面表示，该模型在复杂推理、代码生成以及智能体应用场景中表现尤为突出，同时也能够胜任日常问答、写作和内容创作等通用任务。

01 整体表现：开源模型中的第一梯队从公开披露的多项权威基准测试结果来看，MiMo‑V2‑Flash已跻身当前全球开源大模型的第一梯队。
在数学与科学推理能力方面，MiMo‑V2‑Flash在2025年AIME数学竞赛基准中取得94.1分，在开源模型中名列前茅，仅次于少数顶级闭源模型；在高难度科学问答基准GPQA‑Diamond中，其得分达到83.7，同样位居开源模型领先位置。此外，在MMLU‑ro和HMMT等综合推理测试中，模型也维持了稳定的高分表现。
在软件工程和代码能力方面，MiMo‑V2‑Flash在SWE‑bench Verified基准中取得73.4分，在多语言版本的SWE‑bench测试中得分71.7，均为当前开源模型中的最高或并列最高水平，显示出其在真实工程修复、复杂代码理解和生成方面的成熟度。
在长上下文和通用能力测试中，该模型支持最长256k上下文，在LongBench V2测试中取得60.6分；在强调创造性写作能力的Arena‑Hard基准中，得分达到86.2，表明其不仅是“技术型模型”，也具备较强的通用内容生成能力。
02 价格与效率：主打“高性价比”
在推理效率和使用成本方面，MiMo‑V2‑Flash将“低成本、高吞吐”作为核心卖点之一。
根据官方数据，该模型的推理速度最高可达每秒150个tokens。在价格上，输入tokens的费用为每百万0.1美元，输出tokens为每百万0.3美元，明显低于当前主流高性能模型的市场价格。
小米称，这一定价策略旨在降低大模型应用门槛，使其更适合大规模部署和商业化使用。
03 模型架构：更容易理解的技术路径
从架构上看，MiMo‑V2‑Flash采用了“混合专家模型”（MoE）设计，总参数规模为3090亿，但在实际运行时每次仅激活约150亿参数。这种方式可以在保证模型能力的同时，大幅降低计算资源消耗。
在注意力机制上，该模型采用了全局注意力与滑动窗口注意力相结合的混合方案。简单来说，模型在需要“纵观全局”时使用全注意力，在处理长文本或连续对话时则更多依赖滑动窗口注意力。这种设计在保持理解能力的同时，提高了运行效率，也降低了显存占用。
此外，MiMo‑V2‑Flash支持“混合思维模式”，用户可以选择让模型进行更长时间的内部推理，或者直接给出快速回答，以适配不同使用场景。
04 智能体与应用场景
MiMo‑V2‑Flash并非只面向单轮问答，而是被明确设计为适用于智能体任务的基础模型。
该模型能够在超长上下文中持续进行多轮决策和工具调用，适用于自动编程、复杂任务拆解、网页生成等应用场景。例如，它可以一键生成可直接使用的HTML网页，并与Claude Code、Cursor、Cline等主流“vibe‑coding”工具链协同工作。
05 不只是技术模型：通用与人文能力
除了推理和代码能力，小米强调MiMo‑V2‑Flash在通用智能和人文表达方面的表现。
官方示例显示，该模型能够对“大语言模型是否拥有知识”这类高度抽象的问题进行结构化分析。
也可以围绕“永生是否值得追求”等哲学和伦理议题展开多角度讨论。
同时，它在文学创作方面表现稳定，能够根据复杂指令生成具有时代背景和情绪张力的故事文本，或完成关注社会议题的非虚构写作。
06 后训练方法：MOPD的新尝试

在模型训练方法上，小米研究团队提出了一种名为“多教师在线策略蒸馏”（MOPD）的新范式。
与传统需要大量强化学习计算资源的流程不同，MOPD通过让学生模型在自身策略下生成答案，再由多个专家教师模型提供细粒度反馈进行优化，大幅降低了训练成本。官方称，该方法所需计算资源不到传统SFT加RL流程的1/50，却能够逼近甚至达到教师模型的峰值性能。
这一机制还支持持续迭代：经过蒸馏的模型可以反过来成为新的教师模型，形成能力不断增强的闭环。
07 完全开源：权重与代码同步开放
与此前小米在开源模型上的立场一致，MiMo‑V2‑Flash选择“完全开源”。包括MiMo‑V2‑Flash‑Base在内的模型权重已在Hugging Face平台以MIT许可证发布。
同时，小米在发布当天就将全部推理代码贡献给了SGLang，并与该社区合作，在LMSYS博客上分享了关于模型推理效率和部署实践的经验。
总体来看，MiMo‑V2‑Flash并非单点技术突破，而是一款在性能、成本、开源策略和应用场景上都具有明确定位的基础模型。在当前全球大模型竞争加速、成本与效率日益重要的背景下，小米正试图通过这款模型，争夺开源生态中的关键位置。

本主题由版主或管理员于 2025-12-17 10:40 审核通过

0 举报本楼

本帖有 4 个回帖，您需要登录后才能浏览登录 | 注册

返回列表

版规|手机版|C114 ( 沪ICP备12002291号-1 )|联系我们 |网站地图

GMT+8, 2025-12-17 21:06 , Processed in 0.301408 second(s), 16 queries , Gzip On.

Discuz Licensed

		自动登录	找回密码
密码			注册