使用 fast mode 加速响应
Source: Hacker News
切换快速模式
以以下任意方式切换快速模式:
- 输入
/fast并按 Tab 键以打开或关闭。 - 在你的用户设置文件中设置
"fastMode": true。
快速模式会在会话之间保持。为了获得最佳的成本效率,请在会话开始时启用快速模式,而不是在对话进行中切换。详情请参见 了解成本权衡。
启用快速模式时:
- 如果你使用的是其他模型,Claude Code 会自动切换到 Opus 4.6。
- 你会看到确认信息:“Fast mode ON”。
- 在快速模式激活期间,提示符旁会出现一个小
↯图标。 - 随时再次运行
/fast以检查快速模式是开启还是关闭。
再次使用 /fast 关闭快速模式后,你仍然停留在 Opus 4.6。模型不会恢复到之前的模型。若要切换到其他模型,请使用 /model。
理解成本权衡
Fast mode 的每标记定价高于标准 Opus 4.6:
| 模式 | 输入 (MTok) | 输出 (MTok) | 价格 (USD) |
|---|---|---|---|
| Opus 4.6(200 K)快速模式 | $60 | $225 | — |
快速模式兼容 1 M 标记的扩展上下文窗口。
如果在对话中途切换到快速模式,您需要为整个对话上下文支付完整的快速模式未缓存输入标记价格,这比从一开始就启用快速模式更昂贵。
决定何时使用快速模式
快速模式最适合响应延迟比成本更重要的交互式工作:
- 对代码更改的快速迭代
- 实时调试会话
- 时间紧迫、截止日期紧张的工作
标准模式更适用于:
- 速度不太重要的长期自主任务
- 批处理或 CI/CD 流水线
- 成本敏感的工作负载
快速模式 vs 努力级别
| 设置 | 效果 |
|---|---|
| 快速模式 | 相同的模型质量,更低的延迟,更高的成本 |
| 较低的努力级别 | 思考时间更少,响应更快,在复杂任务上可能质量较低 |
您可以两者结合:在直接任务上使用快速模式并配合较低的努力级别以获得最大速度。
要求
快速模式需要满足以下所有条件:
- 不适用于第三方云提供商:在 Amazon Bedrock、Google Vertex AI 或 Microsoft Azure Foundry 上不可用。它可通过 Anthropic Console API 以及使用额外用量的 Claude 订阅计划获得。
- 已启用额外用量:您的账户必须启用额外用量,以便在计划包含的用量之外进行计费。个人账户请在您的 Console billing settings 中启用。对于 Teams 和 Enterprise,管理员必须为组织启用额外用量。
- Teams 与 Enterprise 的管理员启用:快速模式默认在 Teams 和 Enterprise 组织中被禁用。管理员必须显式启用后,用户才能使用。
为您的组织启用快速模式
管理员可以在以下位置启用快速模式:
- Console(API 客户):Claude Code preferences
- Claude AI(Teams 和 Enterprise):Admin Settings > Claude Code – link
处理速率限制
Fast mode 有独立于标准 Opus 4.6 的速率限制。当你触发快速模式速率限制或用完额外使用额度时:
- 快速模式会自动回退到标准 Opus 4.6。
↯图标会变成灰色以表示冷却中。- 你将以标准速度和费用继续工作。
- 冷却结束后,快速模式会自动重新启用。
若想手动禁用快速模式而不是等待冷却,请再次运行 /fast。
研究预览
Fast mode 是一个研究预览功能,这意味着:
- 该功能可能会根据反馈进行更改。
- 可用性和定价可能会有所变动。
- 底层 API 配置可能会演进。
通过您常用的 Anthropic 支持渠道报告问题或反馈。