2025年12月12日 | Tongyi Weekly:来自Tongyi Lab的每周前沿AI精选
发布: (2025年12月12日 GMT+8 13:59)
5 min read
原文: Dev.to
Source: Dev.to
Qwen3‑Omni‑Flash (2025‑12‑01) – 更聪明、更具人性
- 增强的多轮视频/音频理解——对话自然流畅。
- 通过系统提示自定义 AI 的人格(想象角色扮演情境!)。
- 更智能的语言处理 + 稳如磐石的支持:119 种文本语言 | 19 种语音。
- 声音与真人难辨。
立即体验:
Qwen Chat – 点击右下角的 VoiceChat 和 VideoChat 按钮。
Qwen3‑TTS (2025‑11‑27) – 逼真的声音
- 更多人格化声音: 超过 49 种高质量声音,涵盖可爱活泼到睿智严肃。
- 全球覆盖: 支持 10 种语言(zh、en、de、it、pt、es、ja、ko、fr、ru)以及真实方言(闽南、吴、粤、川、京、宁、津、陕)。
- 极致自然: 节奏与速度如真人般自适应。
立即体验:
Qwen Chat – 点击 Response → Read aloud。
Qwen Code v0.2.2 → v0.3.0:流式 JSON + 全球化
流式 JSON 支持
--output-format stream-json用于流式输出。--input-format stream-json用于结构化输入。- 3 层适配器架构 + 完整会话管理。
- 为 SDK 集成、自动化工具、CI/CD 流水线提供无限可能。
完整国际化
- 内置 EN/CN 界面 + 可自定义语言包扩展。
/language ui zh-CN– 一键切换 UI。/language output Chinese– 设置 AI 输出语言。- 欢迎全球开发者贡献本地语言包。
安全性与稳定性大幅提升
Qwen Learn Mode — 你的个人 AI 学习导师
- 通过苏格拉底式对话引导,而非直接给出答案。
- 根据你的当前水平自适应,保持在最佳学习区间。
- 构建认知脚手架,让你在不感到压迫的情况下处理复杂逻辑。
✨ 尝试学习模式
SAPO:更平滑的强化学习训练路径
- 平滑的信任域行为 → 没有突兀的梯度下降。
- 序列层面的一致性 → 对齐的序列行为。
- Token 级别的自适应 → 保留有用梯度并提升样本效率。
- 非对称温度 → 稳定性显著提升,尤其在 MoE 模型中。
实际意义:
- 更长的稳定 RL 运行时长。
- 更高的 Pass@1。
- 在 Qwen3‑VL 的数学、编码和多模态任务上表现更强。
模型里程碑:Z‑Image‑Turbo
- #1 开源模型 – 综合排名前 10,列表中唯一的开源模型。
- 高保真输出,$5/1k 计费,完全开源。
- 可访问、经济且社区驱动的生成式 AI。
Qwen3‑4B:微调首选 #1 基础模型
XiYan‑SQL:所有公开 BIRD‑CRITIC 排行榜 #1
- 不仅是文本 → SQL:诊断并修复失败的查询。
- 处理复杂操作(INSERT / UPDATE / DELETE)以及混杂的多方言数据库。
- 在未见、分布外的数据库上依然保持鲁棒。
实际意义:
- 在真实生产环境中实现更可靠的 SQL 调试。
- 对混乱且不断演进的数据堆栈拥有更强的鲁棒性。
社区庆典:WanMuse+ “Heartbeat” 获奖者公布
🎉 恭喜所有入围者和获奖者!
轻量迁移 LoRA:Qwen‑Edit‑2509‑Light‑Migration
放大 LoRA:Qwen‑Image‑Edit‑2509‑Upscale2K
订阅
不再错过任何发布:
Subscribe to The Tongyi Weekly
关于通义实验室
通义实验室是阿里巴巴集团旗下的人工智能与基础模型研究机构。其工作涵盖大语言模型(LLMs)、多模态理解与生成、视觉 AIGC、语音技术等多个方向。