fast mode로 응답 속도 높이기
Source: Hacker News
토글 빠른 모드
다음 두 가지 방법 중 하나로 빠른 모드를 토글하세요:
/fast를 입력하고 Tab 키를 눌러 켜거나 끕니다.- 사용자 설정 파일에서
"fastMode": true로 설정합니다.
빠른 모드는 세션 간에 지속됩니다. 비용 효율성을 최대로 하려면 대화 중에 전환하기보다 세션 시작 시 빠른 모드를 활성화하세요. 자세한 내용은 비용 절충 이해를 참고하세요.
빠른 모드를 활성화하면:
- 다른 모델을 사용 중인 경우 Claude Code가 자동으로 Opus 4.6으로 전환됩니다.
- 확인 메시지 “Fast mode ON”이 표시됩니다.
- 빠른 모드가 활성화된 동안 프롬프트 옆에 작은
↯아이콘이 나타납니다. - 언제든지
/fast를 다시 실행하면 빠른 모드가 켜져 있는지 꺼져 있는지 확인할 수 있습니다.
/fast 로 빠른 모드를 다시 비활성화하면 Opus 4.6 상태를 유지합니다. 모델이 이전 모델로 되돌아가지 않으며, 다른 모델로 전환하려면 /model 을 사용하세요.
비용 트레이드오프 이해하기
Fast mode는 표준 Opus 4.6보다 토큰당 가격이 높습니다:
| 모드 | 입력 (MTok) | 출력 (MTok) | 가격 (USD) |
|---|---|---|---|
| Fast mode on Opus 4.6 ( 200 K) | $60 | $225 | — |
Fast mode는 1 M 토큰 확장 컨텍스트 창과 호환됩니다.
대화 중에 fast mode로 전환하면 전체 대화 컨텍스트에 대해 캐시되지 않은 fast‑mode 입력 토큰 가격을 전액 지불하게 되며, 처음부터 fast mode를 활성화하는 것보다 비용이 더 많이 듭니다.
빠른 모드 사용 시점 결정
빠른 모드는 응답 지연이 비용보다 더 중요한 대화형 작업에 적합합니다:
- 코드 변경에 대한 빠른 반복
- 실시간 디버깅 세션
- 촉박한 마감일이 있는 시간 민감 작업
표준 모드는 다음에 더 적합합니다:
- 속도가 덜 중요한 장기 자동 작업
- 배치 처리 또는 CI/CD 파이프라인
- 비용에 민감한 워크로드
빠른 모드 vs 노력 수준
| 설정 | 효과 |
|---|---|
| 빠른 모드 | 동일한 모델 품질, 낮은 지연 시간, 높은 비용 |
| 낮은 노력 수준 | 생각하는 시간이 짧아져 응답이 빨라지고, 복잡한 작업에서는 품질이 낮아질 수 있음 |
두 가지를 결합할 수 있습니다: 직관적인 작업에 대해 최대 속도를 위해 노력 수준을 낮춘 빠른 모드를 사용하세요.
요구 사항
Fast mode를 사용하려면 다음 모든 조건을 충족해야 합니다:
- 타사 클라우드 제공업체에서는 사용 불가: Amazon Bedrock, Google Vertex AI, Microsoft Azure Foundry에서는 사용할 수 없습니다. Anthropic Console API와 추가 사용량이 포함된 Claude 구독 플랜을 통해 이용할 수 있습니다.
- 추가 사용량 활성화: 계정에 추가 사용량이 활성화되어 있어야 하며, 이는 플랜에 포함된 사용량을 초과하는 청구를 허용합니다. 개인 계정의 경우 Console 청구 설정에서 활성화합니다. Teams 및 Enterprise의 경우 관리자가 조직에 대해 추가 사용량을 활성화해야 합니다.
- Teams 및 Enterprise용 관리자 활성화: Fast mode는 Teams 및 Enterprise 조직에서 기본적으로 비활성화되어 있습니다. 관리자가 명시적으로 활성화해야 사용자가 접근할 수 있습니다.
조직에서 Fast mode 활성화하기
관리자는 다음 위치에서 Fast mode를 활성화할 수 있습니다:
- Console (API 고객): Claude Code preferences
- Claude AI (Teams 및 Enterprise): Admin Settings > Claude Code – link
속도 제한 처리
Fast 모드는 표준 Opus 4.6과 별도의 속도 제한을 가지고 있습니다. Fast‑mode 속도 제한에 도달하거나 추가 사용 크레딧이 소진될 경우:
- Fast 모드는 자동으로 표준 Opus 4.6으로 전환됩니다.
↯아이콘이 회색으로 변해 쿨다운을 표시합니다.- 표준 속도와 요금으로 작업을 계속합니다.
- 쿨다운이 끝나면 Fast 모드가 자동으로 다시 활성화됩니다.
쿨다운을 기다리는 대신 Fast 모드를 수동으로 비활성화하려면 /fast를 다시 실행하세요.
연구 미리보기
- 이 기능은 피드백에 따라 변경될 수 있습니다.
- 이용 가능 여부와 가격은 변경될 수 있습니다.
- 기본 API 구성은 진화할 수 있습니다.
문제나 피드백은 기존 Anthropic 지원 채널을 통해 보고해 주세요.
참고
- Model configuration: 모델을 전환하고 노력 수준을 조정합니다
- Manage costs effectively: 토큰 사용량을 추적하고 비용을 절감합니다
- Status line configuration: 모델 및 컨텍스트 정보를 표시합니다