GLM-4.7 现已在 SiliconFlow 上:高级编码、推理与工具使用能力

发布: (2025年12月25日 GMT+8 21:30)
3 分钟阅读
原文: Dev.to

Source: Dev.to

概览

GLM‑4.7,Z.ai 最新的旗舰模型,现已在 SiliconFlow 上提供 Day 0 支持。与其前身 GLM‑4.6 相比,此次发布在编码、复杂推理和工具使用方面带来了显著进步——性能可与 Claude Sonnet 4.5、GPT‑5.1 等业界领袖相媲美,甚至超越。

SiliconFlow 目前已支持整个 GLM 系列,包括 GLM‑4.5、GLM‑4.5‑Air、GLM‑4.5V、GLM‑4.6、GLM‑4.6V,现已加入 GLM‑4.7。

SiliconFlow Day 0 支持

  • 竞争性定价:GLM‑4.7 $0.6 / M token(输入)和 $2.2 / M token(输出)
  • 205K 上下文窗口:应对复杂编码任务、深度文档分析以及扩展的代理工作流。
  • Anthropic 与 OpenAI 兼容的 API:通过 SiliconFlow 部署,并可无缝集成到 Claude Code、Kilo Code、Cline、Roo Code 等主流代理工作流中。

GLM‑4.7 的独特之处

核心编码卓越

GLM‑4.7 为多语言、代理式编码和终端任务树立了新标杆。相较于 GLM‑4.6,提升幅度显著:

  • 73.8 %(+5.8 %)在 SWE‑bench Verified 上
  • 66.7 %(+12.9 %)在 SWE‑bench Multilingual 上
  • 41 %(+16.5 %)在 Terminal Bench 2.0 上

模型现已支持“先思考后行动”,在主流代理框架下的复杂任务上表现更为可靠。

Vibe 编码

GLM‑4.7 在 UI 质量上实现了重大跃进。它能够生成更简洁、更现代的网页,并生成外观更佳、布局和尺寸更精准的幻灯片——非常适合原型界面或演示文稿的制作。

高级工具使用

工具利用能力得到显著增强。在多步骤基准如 τ²‑Bench 以及通过 BrowseComp 的网页浏览任务中,GLM‑4.7 超越 Claude Sonnet 4.5 与 GPT‑5.1 High,展示了在复杂真实工作流中的卓越能力。

复杂推理能力

数学与推理能力大幅提升,GLM‑4.7 在 HLE(Humanity’s Last Exam)基准上取得 42.8 %(+12.4 %)的成绩,相较于 GLM‑4.6 有明显进步。聊天、创意写作和角色扮演场景也表现出显著提升。

GLM‑4.7 性能图表

立即开始

探索 – 在 SiliconFlow Playground 中尝试 GLM‑4.7

集成 – 使用兼容 OpenAI/Anthropic 的 API。完整规格请参见 SiliconFlow API 文档

import requests

url = "https://api.siliconflow.com/v1/chat/completions"

payload = {
    "model": "zai-org/GLM-4.7",
    "messages": [
        {"role": "system", "content": "You are an assistant"},
        {"role": "user", "content": "What's the weather like in America?"}
    ],
    "stream": True,
    "max_tokens": 4096,
    "enable_thinking": True,
    "temperature": 1,
    "top_p": 0.95
}
headers = {
    "Authorization": "Bearer ",
    "Content-Type": "application/json"
}

response = requests.post(url, json=payload, headers=headers)
print(response.text)
Back to Blog

相关文章

阅读更多 »