2025年12月12日 | Tongyi Weekly:来自Tongyi Lab的每周前沿AI精选

发布: (2025年12月12日 GMT+8 13:59)
5 min read
原文: Dev.to

Source: Dev.to

Qwen3‑Omni‑Flash (2025‑12‑01) – 更聪明、更具人性

  • 增强的多轮视频/音频理解——对话自然流畅。
  • 通过系统提示自定义 AI 的人格(想象角色扮演情境!)。
  • 更智能的语言处理 + 稳如磐石的支持:119 种文本语言 | 19 种语音
  • 声音与真人难辨。

立即体验:
Qwen Chat – 点击右下角的 VoiceChatVideoChat 按钮。


Qwen3‑TTS (2025‑11‑27) – 逼真的声音

  • 更多人格化声音: 超过 49 种高质量声音,涵盖可爱活泼到睿智严肃。
  • 全球覆盖: 支持 10 种语言(zh、en、de、it、pt、es、ja、ko、fr、ru)以及真实方言(闽南、吴、粤、川、京、宁、津、陕)。
  • 极致自然: 节奏与速度如真人般自适应。

立即体验:
Qwen Chat – 点击 Response → Read aloud


Qwen Code v0.2.2 → v0.3.0:流式 JSON + 全球化

流式 JSON 支持

  • --output-format stream-json 用于流式输出。
  • --input-format stream-json 用于结构化输入。
  • 3 层适配器架构 + 完整会话管理。
  • 为 SDK 集成、自动化工具、CI/CD 流水线提供无限可能。

完整国际化

  • 内置 EN/CN 界面 + 可自定义语言包扩展。
  • /language ui zh-CN – 一键切换 UI。
  • /language output Chinese – 设置 AI 输出语言。
  • 欢迎全球开发者贡献本地语言包。

安全性与稳定性大幅提升

GitHub Repository


Qwen Learn Mode — 你的个人 AI 学习导师

  • 通过苏格拉底式对话引导,而非直接给出答案。
  • 根据你的当前水平自适应,保持在最佳学习区间。
  • 构建认知脚手架,让你在不感到压迫的情况下处理复杂逻辑。

尝试学习模式


SAPO:更平滑的强化学习训练路径

  • 平滑的信任域行为 → 没有突兀的梯度下降。
  • 序列层面的一致性 → 对齐的序列行为。
  • Token 级别的自适应 → 保留有用梯度并提升样本效率。
  • 非对称温度 → 稳定性显著提升,尤其在 MoE 模型中。

实际意义:

  • 更长的稳定 RL 运行时长。
  • 更高的 Pass@1。
  • 在 Qwen3‑VL 的数学、编码和多模态任务上表现更强。

Paper on arXiv
Technical Blog


模型里程碑:Z‑Image‑Turbo

  • #1 开源模型 – 综合排名前 10,列表中唯一的开源模型。
  • 高保真输出,$5/1k 计费,完全开源。
  • 可访问、经济且社区驱动的生成式 AI。

Qwen3‑4B:微调首选 #1 基础模型

Read the full report


XiYan‑SQL:所有公开 BIRD‑CRITIC 排行榜 #1

  • 不仅是文本 → SQL:诊断并修复失败的查询。
  • 处理复杂操作(INSERT / UPDATE / DELETE)以及混杂的多方言数据库。
  • 在未见、分布外的数据库上依然保持鲁棒。

实际意义:

  • 在真实生产环境中实现更可靠的 SQL 调试。
  • 对混乱且不断演进的数据堆栈拥有更强的鲁棒性。

社区庆典:WanMuse+ “Heartbeat” 获奖者公布

🎉 恭喜所有入围者和获奖者!

Learn More


轻量迁移 LoRA:Qwen‑Edit‑2509‑Light‑Migration

Try it here


放大 LoRA:Qwen‑Image‑Edit‑2509‑Upscale2K

Try it here


订阅

不再错过任何发布:

Subscribe to The Tongyi Weekly


关于通义实验室

通义实验室是阿里巴巴集团旗下的人工智能与基础模型研究机构。其工作涵盖大语言模型(LLMs)、多模态理解与生成、视觉 AIGC、语音技术等多个方向。

Back to Blog

相关文章

阅读更多 »

Gemini 3 的新 Gemini API 更新

Gemini 3,我们最智能的模型,现已通过 Gemini API 向开发者开放。为支持其最先进的推理、自主编码、多模态…

Gemini 3 的新 Gemini API 更新

Gemini 3,我们最智能的模型,现在可通过 Gemini API 供开发者使用构建。为了支持其最先进的推理,自治 co…

Gemini 3 的新 Gemini API 更新

2025年11月25日 Gemini 3的 Gemini API 新功能——简化的思考控制参数——全新 thinking_level 参数让您可以设置思考的深度……