使用 fast mode 加速响应

发布: (2026年2月8日 GMT+8 02:08)
6 分钟阅读

Source: Hacker News

切换快速模式

以以下任意方式切换快速模式:

  • 输入 /fast 并按 Tab 键以打开或关闭。
  • 在你的用户设置文件中设置 "fastMode": true

快速模式会在会话之间保持。为了获得最佳的成本效率,请在会话开始时启用快速模式,而不是在对话进行中切换。详情请参见 了解成本权衡

启用快速模式时:

  • 如果你使用的是其他模型,Claude Code 会自动切换到 Opus 4.6。
  • 你会看到确认信息:“Fast mode ON”。
  • 在快速模式激活期间,提示符旁会出现一个小 图标。
  • 随时再次运行 /fast 以检查快速模式是开启还是关闭。

再次使用 /fast 关闭快速模式后,你仍然停留在 Opus 4.6。模型不会恢复到之前的模型。若要切换到其他模型,请使用 /model

理解成本权衡

Fast mode 的每标记定价高于标准 Opus 4.6:

模式输入 (MTok)输出 (MTok)价格 (USD)
Opus 4.6(200 K)快速模式$60$225

快速模式兼容 1 M 标记的扩展上下文窗口。
如果在对话中途切换到快速模式,您需要为整个对话上下文支付完整的快速模式未缓存输入标记价格,这比从一开始就启用快速模式更昂贵。

决定何时使用快速模式

快速模式最适合响应延迟比成本更重要的交互式工作:

  • 对代码更改的快速迭代
  • 实时调试会话
  • 时间紧迫、截止日期紧张的工作

标准模式更适用于:

  • 速度不太重要的长期自主任务
  • 批处理或 CI/CD 流水线
  • 成本敏感的工作负载

快速模式 vs 努力级别

设置效果
快速模式相同的模型质量,更低的延迟,更高的成本
较低的努力级别思考时间更少,响应更快,在复杂任务上可能质量较低

您可以两者结合:在直接任务上使用快速模式并配合较低的努力级别以获得最大速度。

要求

快速模式需要满足以下所有条件:

  • 不适用于第三方云提供商:在 Amazon Bedrock、Google Vertex AI 或 Microsoft Azure Foundry 上不可用。它可通过 Anthropic Console API 以及使用额外用量的 Claude 订阅计划获得。
  • 已启用额外用量:您的账户必须启用额外用量,以便在计划包含的用量之外进行计费。个人账户请在您的 Console billing settings 中启用。对于 Teams 和 Enterprise,管理员必须为组织启用额外用量。
  • Teams 与 Enterprise 的管理员启用:快速模式默认在 Teams 和 Enterprise 组织中被禁用。管理员必须显式启用后,用户才能使用。

为您的组织启用快速模式

管理员可以在以下位置启用快速模式:

处理速率限制

Fast mode 有独立于标准 Opus 4.6 的速率限制。当你触发快速模式速率限制或用完额外使用额度时:

  • 快速模式会自动回退到标准 Opus 4.6。
  • 图标会变成灰色以表示冷却中。
  • 你将以标准速度和费用继续工作。
  • 冷却结束后,快速模式会自动重新启用。

若想手动禁用快速模式而不是等待冷却,请再次运行 /fast

研究预览

Fast mode 是一个研究预览功能,这意味着:

  • 该功能可能会根据反馈进行更改。
  • 可用性和定价可能会有所变动。
  • 底层 API 配置可能会演进。

通过您常用的 Anthropic 支持渠道报告问题或反馈。

另见

0 浏览
Back to Blog

相关文章

阅读更多 »

Scrap Labs – 金属3D打印机

真实金属打印。由废料构建。 在Scrap Labs,我们的使命是通过最先进的金属打印技术赋能建设者和创作者,使其……

福尔克轮

概述:世界上唯一的旋转船闸——Falkirk Wheel,将Forth & Clyde Canal与Union Canal在35米高空相连,允许船只航行……