有事在 Qwen 的土地上酝酿

发布: (2026年3月4日 GMT+8 23:55)
5 分钟阅读

Source: Hacker News

阿里巴巴 Qwen 团队的最新动态

辞职与组织变动

事情的开端是一条来自林俊阳(@JustinLin610)的推文:

我下线了。再见,我亲爱的 Qwen。

林俊阳是 Qwen 的首席研究员,负责从 2024 年起发布开源权重模型。他辞职的可能原因是阿里巴巴内部重组,将一位新招聘自 Google Gemini 团队的研究员调任为 Qwen 负责人,尽管这一细节尚未得到证实。

更多信息出现在 36kr.com(一家成立于 2010 年的可信中文科技媒体;其 Wikipedia 条目在此)的报道中。该文章为中文,以下为译文摘录:

北京时间 3 月 4 日下午 1:00 左右,通义实验室召开紧急全员会议,阿里巴巴集团 CEO 吴永明坦率地向千问员工说明情况。
12 小时前(北京时间 3 月 4 日凌晨 0:11),林俊阳——阿里巴巴 Qwen 大数据模型的技术负责人——在 X(Twitter)上突然宣布辞职。林俊阳是推动阿里巴巴开源 AI 模型的关键人物,也是阿里巴巴最年轻的 P10 员工之一。许多 Qwen 成员难以接受团队核心人物的突如其来的离开。
“在资源远不及竞争对手的情况下,俊阳的领导是实现今天成果的核心因素之一,”多位千问成员对 36Kr 透露。
关于林俊阳的去向,会议上未得出新结论。但大约下午 2 点,他在微信朋友圈再次发文,称“Qwen 的兄弟们,照原计划继续,没问题”,并未明确确认是否会回归。

文章还列出了几位显然已辞职的关键成员:

  • 惠斌源 – Qwen 代码开发负责人,Qwen‑Coder 系列的主要负责人,负责整个 Agent 训练流水线,近期参与机器人研究。
  • 余博文 – Qwen 后训练研究负责人,毕业于中国科学院大学,主导 Qwen‑Instruct 系列的开发。
  • 李开心 – Qwen 3.5/VL/Coder 的核心贡献者,拥有新加坡国立大学的博士学位。

此外,同一天还有许多年轻研究员辞职。阿里巴巴 CEO 亲自出席紧急全员会议,表明公司认识到这些辞职的重大意义,并可能仍保留部分离职人才。

Qwen 3.5 非常出色

这个故事之所以让人感到格外沉重,是因为 Qwen 3.5 系列模型表现异常出色。

新模型家族的规模令人印象深刻。它始于 2022 年 2 月 17 日发布的 Qwen‑3.5‑397B‑A17B——一个 807 GB 的模型,随后紧随其后的是一系列更小的兄弟模型,尺寸分别为 122 B、35 B、27 B、9 B、4 B、2 B 和 0.8 B(见 Hugging Face 集合)。

针对 27 B 和 35 B 模型的编码任务已经出现了积极的反馈,这些模型仍能在 32 GB/64 GB 的 Mac 上运行。我也尝试过 9 B、4 B 和 2 B 模型,发现它们在体积极小的情况下表现相当出色。2 B 模型仅 4.57 GB——量化后甚至只有 1.27 GB——却是一个完整的推理和多模态(视觉)模型。

如果 Qwen 团队现在解散,将是一场真正的悲剧,因为他们已经在不断缩小模型体积的同时,持续产出高质量结果。如果这些核心成员开启新项目或加入其他研究实验室,我非常期待看到他们的下一步表现。

0 浏览
Back to Blog

相关文章

阅读更多 »