使用 fast mode 加速响应

发布: 3天前 (2026年2月8日 GMT+8 02:08)

6 分钟阅读

原文: Hacker News

Source: Hacker News

切换快速模式

以以下任意方式切换快速模式：

输入 /fast 并按 Tab 键以打开或关闭。
在你的用户设置文件中设置 "fastMode": true。

快速模式会在会话之间保持。为了获得最佳的成本效率，请在会话开始时启用快速模式，而不是在对话进行中切换。详情请参见 了解成本权衡。

启用快速模式时：

如果你使用的是其他模型，Claude Code 会自动切换到 Opus 4.6。
你会看到确认信息：“Fast mode ON”。
在快速模式激活期间，提示符旁会出现一个小 ↯ 图标。
随时再次运行 /fast 以检查快速模式是开启还是关闭。

再次使用 /fast 关闭快速模式后，你仍然停留在 Opus 4.6。模型不会恢复到之前的模型。若要切换到其他模型，请使用 /model。

理解成本权衡

Fast mode 的每标记定价高于标准 Opus 4.6：

模式	输入 (MTok)	输出 (MTok)	价格 (USD)
Opus 4.6（200 K）快速模式	$60	$225	—

快速模式兼容 1 M 标记的扩展上下文窗口。
如果在对话中途切换到快速模式，您需要为整个对话上下文支付完整的快速模式未缓存输入标记价格，这比从一开始就启用快速模式更昂贵。

决定何时使用快速模式

快速模式最适合响应延迟比成本更重要的交互式工作：

对代码更改的快速迭代
实时调试会话
时间紧迫、截止日期紧张的工作

标准模式更适用于：

速度不太重要的长期自主任务
批处理或 CI/CD 流水线
成本敏感的工作负载

快速模式 vs 努力级别

设置	效果
快速模式	相同的模型质量，更低的延迟，更高的成本
较低的努力级别	思考时间更少，响应更快，在复杂任务上可能质量较低

您可以两者结合：在直接任务上使用快速模式并配合较低的努力级别以获得最大速度。

要求

快速模式需要满足以下所有条件：

不适用于第三方云提供商：在 Amazon Bedrock、Google Vertex AI 或 Microsoft Azure Foundry 上不可用。它可通过 Anthropic Console API 以及使用额外用量的 Claude 订阅计划获得。
已启用额外用量：您的账户必须启用额外用量，以便在计划包含的用量之外进行计费。个人账户请在您的 Console billing settings 中启用。对于 Teams 和 Enterprise，管理员必须为组织启用额外用量。
Teams 与 Enterprise 的管理员启用：快速模式默认在 Teams 和 Enterprise 组织中被禁用。管理员必须显式启用后，用户才能使用。

为您的组织启用快速模式

管理员可以在以下位置启用快速模式：

Console（API 客户）：Claude Code preferences
Claude AI（Teams 和 Enterprise）：Admin Settings > Claude Code – link

处理速率限制

Fast mode 有独立于标准 Opus 4.6 的速率限制。当你触发快速模式速率限制或用完额外使用额度时：

快速模式会自动回退到标准 Opus 4.6。
↯ 图标会变成灰色以表示冷却中。
你将以标准速度和费用继续工作。
冷却结束后，快速模式会自动重新启用。

若想手动禁用快速模式而不是等待冷却，请再次运行 /fast。

研究预览

Fast mode 是一个研究预览功能，这意味着：

该功能可能会根据反馈进行更改。
可用性和定价可能会有所变动。
底层 API 配置可能会演进。

通过您常用的 Anthropic 支持渠道报告问题或反馈。

另见

模型配置：切换模型并调整努力级别
有效管理成本：跟踪令牌使用并降低成本
状态行配置：显示模型和上下文信息

使用 fast mode 加速响应

切换快速模式

理解成本权衡

决定何时使用快速模式

快速模式 vs 努力级别

要求

为您的组织启用快速模式

处理速率限制

研究预览

另见

相关文章

Scrap Labs – 金属3D打印机

福尔克轮

Show HN: Clawe – 开源 Trello 用于代理团队

Tambo 1.0：用于渲染 React 组件的代理的开源工具包