通信人家园

 找回密码
 注册

只需一步,快速开始

短信验证,便捷登录

搜索

军衔等级:

  中将

注册:2016-11-17345
跳转到指定楼层
1#
发表于 2026-3-5 10:41:02 |只看该作者 |倒序浏览
以下文章来源于智能涌现,作者邓咏仪

“我应该要更早知道这些。”

北京时间3月4日下午约13:00,通义实验室紧急召开了All Hands会议,阿里集团CEO吴泳铭向千问员工坦诚表示。

12个小时前(北京时间3月4日凌晨0点11分),阿里千问大模型技术负责人林俊旸在X上突然宣布离职——林俊旸是阿里AI开源模型的核心推手,也是阿里最年轻的P10之一——行业一片哗然之时,Qwen的部分成员也无法接受团队灵魂人物的突然出走。

“在资源远少于竞对的前提下,能取得今天的成绩,俊旸的领导力是核心因素之一。”不止一位千问成员对智能涌现评价。

在会上,以刘大一恒(Qwen RL leader)为代表,部分Qwen成员围绕包括团队拆分、新成员周浩、对模型路线选择、资源投入等等维度,对阿里高层提出了多项疑问。

这场会议与会者包括阿里数位高管、Qwen团队以及通义实验室其他团队成员。围绕团队调整、战略方向等关键议题,包括阿里巴巴CEO吴泳铭,阿里巴巴首席人才官蒋芳、阿里云CTO周靖人做出多个回应。

对于此次调整,阿里高层给出的核心定性是:Qwen没有收缩,这是一次团队扩张,无关任何政治斗争,反而需要投入更多资源。

“我们在快速发展,这波调整是为了扩充更多人才、提供更多资源。”阿里巴巴首席人才官蒋芳也承认沟通存在不足,“这次组织形式没沟通好,新人引入肯定会带来阵型变化,扩大过程中必然涉及到这些,我们可能没处理好。”

有传言称周浩将直接领导林俊旸及其相关团队,但据智能涌现获悉,包括周浩的接任职位,汇报线,尚在讨论中。

会上,阿里高层强调多次,千问基础模型是集团当前最重要的事情,大模型的竞争不仅仅是Qwen团队的事,而是整个阿里集团的事——无论是基础模型研发,还是底层infra建设,都将在集团层面统筹推进,“一定要超越”。

阿里云CTO周靖人则回应了包括招聘名额、算力短缺等尖锐问题:为何外部客户(如大模型创业公司)购买阿里云算力用得顺畅,内部团队反而在算力、招聘名额上捉襟见肘?

周靖人表示,团队处于“资源紧张状态”,内外差异有很多历史原因,未来正在做整体规划,但没有进一步展开说明。

关于林俊旸的动向,会上也没有更新的结论。但下午2点左右,林俊旸再度发布朋友圈,表示“qwen的兄弟们,按照原来安排继续干,没问题的”,并未明确是否回归。

640?wx_fmt=png&from=appmsg&tp=wxpic&wxfrom=5&wx_lazy=1#imgIndex=1
而在数日前,阿里刚刚完成一轮AI战略更新,内部将AI的总称和核心品牌统一为千问,组织层面也迎来了新一轮调整。

“智能涌现”了解到,此前Qwen拥有自己的预训练、后训练、Infra团队;从模型模态上看,也有语言模型、多模态、代码等多个方向。

过往,训单模态模型曾是业界主流。然而,随着对视觉理解需求的日益增长,视觉语言模型(Vision Language Model)应运而生,这也使得各个模态的深度融合成为一大发展趋势。

一位知情人士曾对“智能涌现”表示,从2025年开始,林俊旸就在寻求让Qwen内部的语言、图像、视频、代码等方向的员工一起工作,以寻求提升模型训练效率。Qwen团队曾提出与万相团队合并,但没有完成,才开始做了自己的qwen-image模型。

但在这轮调整中,通义实验室希望将Qwen团队按预训练、后训练、视觉理解、图像等维度拆分,和通义实验室中的团队合并(如通义万相、通义百聆等团队),一起工作。但在没有充分信息沟通的情况下,矛盾就此爆发。

640?wx_fmt=png&from=appmsg#imgIndex=21
“林俊旸,他一个人就值一亿美金”
就在3月2日晚间,千问还在X上宣布开源四款Qwen 3.5小尺寸模型,马斯克点赞了这条推文,并表示“令人惊叹的智能密度。”

千问模型灵魂人物林俊旸毫无征兆地突然提出离职,让Qwen团队陷入迷茫。

在前任阿里千问技术负责人周畅离职后,生于1993年的林俊旸从2022年起开始接手阿里Qwen团队,负责整体技术工作。

这几年间,阿里Qwen模型家族也在快速发展,从最开始的通义模型家族到Qwen 2.5、Qwen 3.5等系列模型,在多个维度上,Qwen都是毫无疑问的开源模型第一家族,阿里也一路成长为世界一流模型团队。

多位前阿里模型团队人士对“智能涌现”都曾表示,2023年国内大模型刚起步时,国内大厂对是否开源、开源力度多少也有分歧。但阿里的开源战略做得足够早,足够有战略定力,周畅、林俊旸等人在其中发挥了积极推动作用。

而随着林俊旸离开,一同宣布离职的,还有多位Qwen成员,其中有负责Qwen各个模型细分方向的核心负责人,如:

  • 惠彬原(Binyuan Hui):Qwen代码方向负责人,Qwen-Coder系列模型主理人,负责从预训练到后训练的全流程Agent训练,近期也有参与具身智能(Robotics)相关研究。
  • 郁博文(Bowen Yu):Qwen后训练研究负责人,毕业于中国科学院大学,主导 Qwen-Instruct系列模型的开发。
  • Kaixin Li:Qwen 3.5/VL/Coder的核心贡献者,毕业于新加坡国立大学。

除了上述几位人员,还有数位年轻研究员,也在同一天提出了离职。

不止一位Qwen研究员在推特、小红书发布情绪低落的推文。“Qwen is nothing without its people.”这番发言套用了2024年OpenAI陷入CEO更换风波时,OpenAI员工在推特上的刷屏发言。

640?wx_fmt=png&from=appmsg&tp=wxpic&wxfrom=5&wx_lazy=1#imgIndex=2

林俊旸官宣离职在AI社区引起了巨大轰动,很多反馈来自海外开发者,均在表达对林俊旸推动Qwen开源工作的感谢。“一个时代的结束。”Hyperbolic Labs创始人兼CTO Yuchen Jin表示。

640?wx_fmt=png&from=appmsg&tp=wxpic&wxfrom=5&wx_lazy=1#imgIndex=3

“如果这一批人真要是离开了,Qwen模型至少得耽误半年到1年,重组团队重新训。”一位投资人对“智能涌现”评价。另一位字节AI人士则称“林俊旸至少是1亿美金以上级别的人才。”

不少传言称,林俊旸离开是“非自愿”,但经“智能涌现”确认,林俊旸在3月3日提出离职,并且还没有和阿里谈好相关的细节,Qwen团队成员在3月4日下午得到的消息。

“智能涌现”最新得到的消息是,阿里巴巴高层还和林俊旸密切沟通中,林俊旸是否确认离开阿里巴巴还未可知。

林俊旸离开后,即将接手阿里Qwen后训练工作的新成员,是来自Google DeepMind的周浩。一位Qwen团队人士对“智能涌现”称,周浩于2026年1月短暂入职夸克,而后调至通义实验室。从汇报线上看,周浩直接汇报给周靖人,不少声音称,他将接手Qwen的后训练工作。

周浩(Hao Zhou)本科毕业于中科大,博士毕业于威斯康星大学麦迪逊分校(UW-Madison)。据他的领英主页,他曾于Meta工作3年,在Google DeepMind工作约4年,是Gemini 3.0模型的核心贡献者,亲自带队落地了带工具与思考链的多步RL方向,并深度参与了Gemini 1.0、AI Mode及Deep Research等项目。

640?wx_fmt=png&from=appmsg#imgIndex=24
阿里在开源上赢了口碑,但它还想要更多
就在3月3日,林俊旸刚刚在X(推特)上发布数款小尺寸的开源模型,这些模型适用于手机等,也贯彻了Qwen一直以来的开源路线。

很多人认为将做开源模型粗暴理解为“做慈善”,但这并不公允。

开源做得好,首先服务了整个阿里云的开发者生态。因为更早做开源,Qwen模型家族在模型发展早期能够快速得到社区反馈,成长迅速,反哺了模型训练。

Qwen全尺寸、全模态的模型路线,让很多企业、学校的技术从业者能够很快选用到合适自己的模型,建立了一波好口碑。在这些模型落到生产环境后,很多企业主也会倾向于购买Qwen的模型服务,间接转化成了阿里云的商业收入。

但这其中的商业逻辑很难论证,这也是开源长期以来面临的问题,国内外都如此——Meta花了数十亿美元训练Llama却免费开放,外界至今争论这笔账究竟怎么算,也从来无法体现在Meta财报当中。

而尽管在开源依旧维持着优秀的口碑,但在闭源旗舰模型一侧,阿里在2025年发布的Qwen 3、Qwen-3.5系列,尽管维持在第一梯队,但已有吃力之势。

林俊旸等核心成员离开,很大程度是源于阿里巴巴当前AI战略的快速变化,和基础模型团队的目标产生了差距。

追赶旗舰模型、维持开源领先地位都很重要,但阿里巴巴的基础模型团队训练资源相对有限。

自2023年以来,Qwen家族累计开源了超过400个模型,模型家族涵盖了从0.5B到235B的多个参数规模。很难想象,支撑这些模型更新主力的Qwen团队,仅有100多人。算上通义实验室其他团队,整体为数百人规模。

作为对比,字节负责基模训练的Seed团队就已经近2000人。在各个方向上,阿里投入的绝对人数,是友商的几分之一。数位Qwen人士曾对36氪表示,Qwen的算力、Infra建设缺乏资源和支持,这部分阻碍了模型的迭代速度。

这是如今阿里AI战略急行军的一个激烈切面。2025年11月,千问App上线,大打春节大战,可能只是刚刚拉开AI To C战争的序幕——字节旗下的豆包已然接近2亿日活大关,还有尚未完全发力的腾讯;同时,阿里在旗舰模型也不能掉队——这关系着阿里云的商业化闭环,以及整个阿里集团的未来。

举报本楼

本帖有 6 个回帖,您需要登录后才能浏览 登录 | 注册
您需要登录后才可以回帖 登录 | 注册 |

版规|手机版|C114 ( 沪ICP备12002291号-1 )|联系我们 |网站地图  

GMT+8, 2026-3-6 06:31 , Processed in 0.184260 second(s), 22 queries , Gzip On.

Copyright © 1999-2025 C114 All Rights Reserved

Discuz Licensed

回顶部