通信人家园

 找回密码
 注册

只需一步,快速开始

短信验证,便捷登录

搜索

军衔等级:

  大元帅

注册:2007-12-102340
跳转到指定楼层
1#
发表于 2025-12-17 10:40:02 |只看该作者 |倒序浏览

12月16日消息,小米正式发布并向全球开源新一代基础语言模型MiMo‑V2‑Flash。

这是小米在大模型领域迄今为止最重要的一次技术发布之一。该模型已在发布当日同步上线Hugging Face、API Platform 和AI Studio三大平台,面向全球开发者与普通用户开放使用。

作为小米的旗舰级基础语言模型,MiMo‑V2‑Flash主打“高性能、低成本和超高速度”。小米方面表示,该模型在复杂推理、代码生成以及智能体应用场景中表现尤为突出,同时也能够胜任日常问答、写作和内容创作等通用任务。

01 整体表现:开源模型中的第一梯队

从公开披露的多项权威基准测试结果来看,MiMo‑V2‑Flash已跻身当前全球开源大模型的第一梯队。

在数学与科学推理能力方面,MiMo‑V2‑Flash在2025年AIME数学竞赛基准中取得94.1分,在开源模型中名列前茅,仅次于少数顶级闭源模型;在高难度科学问答基准GPQA‑Diamond中,其得分达到83.7,同样位居开源模型领先位置。此外,在MMLU‑ro和HMMT等综合推理测试中,模型也维持了稳定的高分表现。

在软件工程和代码能力方面,MiMo‑V2‑Flash在SWE‑bench Verified基准中取得73.4分,在多语言版本的SWE‑bench测试中得分71.7,均为当前开源模型中的最高或并列最高水平,显示出其在真实工程修复、复杂代码理解和生成方面的成熟度。

在长上下文和通用能力测试中,该模型支持最长256k上下文,在LongBench V2测试中取得60.6分;在强调创造性写作能力的Arena‑Hard基准中,得分达到86.2,表明其不仅是“技术型模型”,也具备较强的通用内容生成能力。

02 价格与效率:主打“高性价比”

在推理效率和使用成本方面,MiMo‑V2‑Flash将“低成本、高吞吐”作为核心卖点之一。

根据官方数据,该模型的推理速度最高可达每秒150个tokens。在价格上,输入tokens的费用为每百万0.1美元,输出tokens为每百万0.3美元,明显低于当前主流高性能模型的市场价格。

小米称,这一定价策略旨在降低大模型应用门槛,使其更适合大规模部署和商业化使用。

03 模型架构:更容易理解的技术路径

从架构上看,MiMo‑V2‑Flash采用了“混合专家模型”(MoE)设计,总参数规模为3090亿,但在实际运行时每次仅激活约150亿参数。这种方式可以在保证模型能力的同时,大幅降低计算资源消耗。

在注意力机制上,该模型采用了全局注意力与滑动窗口注意力相结合的混合方案。简单来说,模型在需要“纵观全局”时使用全注意力,在处理长文本或连续对话时则更多依赖滑动窗口注意力。这种设计在保持理解能力的同时,提高了运行效率,也降低了显存占用。

此外,MiMo‑V2‑Flash支持“混合思维模式”,用户可以选择让模型进行更长时间的内部推理,或者直接给出快速回答,以适配不同使用场景。

04 智能体与应用场景

MiMo‑V2‑Flash并非只面向单轮问答,而是被明确设计为适用于智能体任务的基础模型。

该模型能够在超长上下文中持续进行多轮决策和工具调用,适用于自动编程、复杂任务拆解、网页生成等应用场景。例如,它可以一键生成可直接使用的HTML网页,并与Claude Code、Cursor、Cline等主流“vibe‑coding”工具链协同工作。

05 不只是技术模型:通用与人文能力

除了推理和代码能力,小米强调MiMo‑V2‑Flash在通用智能和人文表达方面的表现。

官方示例显示,该模型能够对“大语言模型是否拥有知识”这类高度抽象的问题进行结构化分析。

也可以围绕“永生是否值得追求”等哲学和伦理议题展开多角度讨论。

同时,它在文学创作方面表现稳定,能够根据复杂指令生成具有时代背景和情绪张力的故事文本,或完成关注社会议题的非虚构写作。

06 后训练方法:MOPD的新尝试

在模型训练方法上,小米研究团队提出了一种名为“多教师在线策略蒸馏”(MOPD)的新范式。

与传统需要大量强化学习计算资源的流程不同,MOPD通过让学生模型在自身策略下生成答案,再由多个专家教师模型提供细粒度反馈进行优化,大幅降低了训练成本。官方称,该方法所需计算资源不到传统SFT加RL流程的1/50,却能够逼近甚至达到教师模型的峰值性能。

这一机制还支持持续迭代:经过蒸馏的模型可以反过来成为新的教师模型,形成能力不断增强的闭环。

07 完全开源:权重与代码同步开放

与此前小米在开源模型上的立场一致,MiMo‑V2‑Flash选择“完全开源”。包括MiMo‑V2‑Flash‑Base在内的模型权重已在Hugging Face平台以MIT许可证发布。

同时,小米在发布当天就将全部推理代码贡献给了SGLang,并与该社区合作,在LMSYS博客上分享了关于模型推理效率和部署实践的经验。

总体来看,MiMo‑V2‑Flash并非单点技术突破,而是一款在性能、成本、开源策略和应用场景上都具有明确定位的基础模型。在当前全球大模型竞争加速、成本与效率日益重要的背景下,小米正试图通过这款模型,争夺开源生态中的关键位置。






举报本楼

本帖有 4 个回帖,您需要登录后才能浏览 登录 | 注册
您需要登录后才可以回帖 登录 | 注册 |

版规|手机版|C114 ( 沪ICP备12002291号-1 )|联系我们 |网站地图  

GMT+8, 2025-12-17 21:06 , Processed in 0.301408 second(s), 16 queries , Gzip On.

Copyright © 1999-2025 C114 All Rights Reserved

Discuz Licensed

回顶部