z.ai 推出更快、更便宜的 GLM-5 Turbo 模型,适用于代理和 “claws” —— 但它不是开源的
Source: VentureBeat
请提供您希望翻译的完整文本内容,我将按照要求保留来源链接并保持原始格式进行简体中文翻译。
Source: …
Z.ai 宣布 GLM‑5‑Turbo
中国 AI 初创公司 Z.ai(前身为 Zhipu AI),以其强大的开源 GLM 系列大语言模型(LLM)而闻名,现推出 GLM‑5‑Turbo——其开源 GLM‑5 模型的专有变体。公司将 Turbo 定位为针对 OpenClaw‑style 任务(如工具使用、长链执行和持久自动化)进行调优的更快模型。
- 可用性: 通过 Z.ai 在第三方供应商 OpenRouter 上的 API。
- 上下文窗口: ~202.8 K 令牌
- 最大输出: 131.1 K 令牌
- 定价(OpenRouter):
- $0.96 每 M 输入令牌
- $3.20 每 M 输出令牌
在 1 M 总令牌(输入 + 输出)情况下,GLM‑5‑Turbo 的费用 ≈ $0.04 低于其前代模型,依据我们的计算。
模型成本比较
| Model | Input $/M | Output $/M | Total $/M | Source |
|---|---|---|---|---|
| Grok 4.1 Fast | $0.20 | $0.50 | $0.70 | xAI |
| Gemini 3 Flash | $0.50 | $3.00 | $3.50 | |
| Kimi‑K2.5 | $0.60 | $3.00 | $3.60 | Moonshot |
| GLM‑5‑Turbo | $0.96 | $3.20 | $4.16 | OpenRouter |
| GLM‑5 | $1.00 | $3.20 | $4.20 | Z.ai |
| Claude Haiku 4.5 | $1.00 | $5.00 | $6.00 | Anthropic |
| Qwen3‑Max | $1.20 | $6.00 | $7.20 | Alibaba Cloud |
| Gemini 3 Pro | $2.00 | $12.00 | $14.00 | |
| GPT‑5.2 | $1.75 | $14.00 | $15.75 | OpenAI |
| GPT‑5.4 | $2.50 | $15.00 | $17.50 | OpenAI |
| Claude Sonnet 4.5 | $3.00 | $15.00 | $18.00 | Anthropic |
| Claude Opus 4.6 | $5.00 | $25.00 | $30.00 | Anthropic |
| GPT‑5.4 Pro | $30.00 | $180.00 | $210.00 | OpenAI |
GLM‑5‑Turbo 在 Z.ai 的 GLM Coding 订阅中
| Tier | Price (per quarter) | Model Access |
|---|---|---|
| Lite | $27 | GLM‑5 (March) → GLM‑5‑Turbo (April) |
| Pro | $81 | GLM‑5‑Turbo (March) |
| Max | $216 | GLM‑5‑Turbo (March) |
- 企业早期访问 通过 Google 表单进行;被选中的用户可能会提前获得模型。
关键定位与使用场景
- 旨在实现 快速推理 与 深度优化,满足涉及长执行链的真实世界代理工作流。
- 改进方面包括:
- 复杂指令拆解
- 工具使用
- 计划与持久执行
- 长任务的稳定性
目标场景(OpenClaw‑style):
- 信息搜索与收集
- 办公与日常任务自动化
- 数据分析
- 开发与运维
- 通用工作流自动化
Z.ai 将 GLM‑5‑Turbo 定位为面向自主代理的 生产级 模型,而非仅用于聊天的 LLM。
背景:Z.ai 与 GLM‑5
- Founded: 2019 as a Tsinghua University spinoff in Beijing; now one of China’s most prominent foundation‑model companies.
- CEO: Zhang Peng
- IPO: Listed on the Hong Kong Stock Exchange (8 Jan 2026) at HK$116.20 (opening HK$120), market cap HK$52.83 B – the largest independent LLM developer in China.
- Adoption (as of 30 Sep 2025): >12 000 enterprise customers, >80 M end‑user devices, >45 M developers worldwide.
GLM‑5 (Feb 2026) – The Flagship
- Open‑source MIT‑licensed model.
- Record‑low hallucination score on the AA‑Omniscience Index.
- Introduced “Agent Mode”: auto‑generates .docx, .pdf, .xlsx files from prompts.
- Scale: 744 B parameters, 40 B active per token (Mixture‑of‑Experts).
- Training: 28.5 T pre‑training tokens; uses asynchronous RL infrastructure “slime” for reduced bottlenecks and enhanced agentic behavior.
GLM‑5‑Turbo builds on this foundation, keeping the long‑context, agentic orientation while emphasizing speed, stability, and execution for real‑world agent chains.
开发者功能与打包
- 长上下文处理(≈ 200 K 令牌)
- 工具集成和推理支持
- 结构化输出能力
- 通过 OpenRouter(以及 Z.ai 自有 API)打包,便于在以代理为中心的应用中使用。
注意:源文本在 “OpenRouter’s GLM‑” 处意外截断,未提供其余细节。
GLM‑5‑Turbo vs. GLM‑5: 性能、工具支持与市场背景
1. 功能与工具支持
- 工具支持: Turbo 页面列出了对工具、工具选择逻辑和响应格式的支持。
- 实时遥测: OpenRouter 的提供商遥测展示了 GLM‑5 与 GLM‑5‑Turbo 的部署层面对比。
- 注意: 由于 GLM‑5 在多个提供商中出现,而 GLM‑5‑Turbo 仅通过 Z.ai 展示,比较并非完全等价。
2. 吞吐量与延迟
| 指标 | GLM‑5‑Turbo (OpenRouter) | 最快的 GLM‑5 端点 | 其他 GLM‑5 端点 |
|---|---|---|---|
| 吞吐量 (tokens / s) | 48 | Fireworks – 70 Friendli – 58 | Together – 40 |
| 首 token 延迟 (s) | 2.92 | Friendli – 0.41 Parasail – 1.00 DeepInfra – 1.08 | – |
| 端到端完成时间 (s) | 8.16 | Fireworks – 9.34 DeepInfra – 11.23 | – |
要点: GLM‑5‑Turbo 的首 token 延迟较慢,但 整体完成请求更快,相较于列出的 GLM‑5 端点。
3. 工具可靠性
- 工具调用错误率: 0.67 %(GLM‑5‑Turbo)
- GLM‑5 提供商: 错误率范围为 2.33 % 到 6.41 %
对企业团队的意义: 虽然 GLM‑5‑Turbo 在当前 OpenRouter 路由下的初始响应速度不占优势,但其显著更低的工具失败率使其在需要长期运行的代理工作负载中更具吸引力,因为此类场景更看重稳定性而非最快的首 token。
基准测试与定价
- ZClawBench radar chart (z.ai): 突出 GLM‑5‑Turbo 在 OpenClaw 场景中的竞争力,例如:
- 信息检索与收集
- 办公与日常任务
- 数据分析
- 开发与运维
- 自动化
这些视觉材料为 公司提供,并非独立验证,但它们展示了 Z.ai 对两款模型的定位方式:
- GLM‑5 – 广泛编码和开放旗舰模型
- GLM‑5‑Turbo – 针对性代理执行变体
许可细节
- 当前状态: GLM‑5‑Turbo 是 闭源。
- 未来承诺: Z.ai 表示该模型的 能力和发现 将被整合到其 下一次开源模型发布 中。
- 该公司 并未承诺 将 GLM‑5‑Turbo 本身开源,仅会将经验教训纳入未来的开源模型。
历史背景
- Z.ai 早期的 GLM 战略强调 开源发布 和 开权重分发,这帮助它在开发者中获得了可见度。
中国 AI 市场:向混合策略转变
最近的行业动态
- 阿里巴巴的 Qwen 部门 – 最近的报道(路透社,2026 年 3 月 16 日)显示:
- Qwen 部门负责人 林俊阳 辞职(2026 年第三位离职的高级 Qwen 高管)。
- 阿里巴巴 CEO 吴逸德 将直接掌管一个新成立的 AI 业务集团,整合 Qwen 及其他部门。
- 此举发生在激烈的 价格竞争 以及对中国开放模型产品的策略和盈利能力审视之际。
新兴模式
- 开放模型 继续推动采用、开发者好感和生态系统覆盖。
- 高价值变体(企业代理、代码工作流等)正日益 首先以专有产品形式发布。
这与 美国的做法(OpenAI、Anthropic、Google)相呼应:
- 开放 = 分发与社区建设
- 专有 = 主要收入来源
对 GLM‑5‑Turbo 的影响
此次发布标志着中国 AI 领域可能出现 向混合模型的转变:
- 开放 用于广泛分发
- 封闭 用于战略重要、以代理为中心的产品
未来走向:GLM‑5‑Turbo 的底层技术进步最终可能在开放版本中出现,但 最具商业价值的工作 可能会先以 闭源访问 的形式面向企业级代理系统推出。
对开发者的意义
- 产品发布: GLM‑5‑Turbo 提供稳健的吞吐量、竞争性的端到端延迟,以及 极低的工具错误率。
- 战略信号: Z.ai 仍然使用开放模型的语言,但 高影响力、以代理为中心的功能 现在正作为 专有基础设施 提供。
结论: 在评估代理平台时,需要同时考虑 技术优势(速度、可靠性)和 许可/可用性路线图(目前闭源,未来可能下游开源)。这种双重视角有助于你判断 GLM‑5‑Turbo 是否符合你的短期需求和长期开放性目标。