프롬프트 캐싱 – Anthropic 캐시 브레이크포인트를 자동 삽입 (90% 토큰 절감)
Source: Hacker News
MCP 플러그인 · 오픈 소스 · MIT
Claude와 함께, Claude를 위해 구축되었습니다.
프롬프트 캐싱 작동 방식
Anthropic의 캐싱 API는 안정적인 콘텐츠를 서버 측에 5분 동안 저장합니다. 캐시 읽기 비용은 **0.1×**이며, 기존 1× 대비 절감됩니다. 이 플러그인은 자동으로 중단점을 배치합니다.
🐛 BugFix 모드
메시지에서 스택 트레이스를 감지합니다. 버그가 있는 파일 + 오류 컨텍스트를 한 번 캐시합니다. 이후의 모든 후속 질문은 새로운 질문에 대해서만 비용이 청구됩니다.
♻️ Refactor 모드
리팩터 키워드 + 파일 목록을 감지합니다. 이전 패턴, 스타일 가이드, 타입 정의를 캐시합니다. 파일별 지시사항만 다시 전송됩니다.
📂 파일 추적
파일별 읽기 횟수를 추적합니다. 두 번째 읽기 시 캐시 중단점을 삽입합니다. 이후 모든 읽기 비용은 0.1×이며, 기존 1× 대비 절감됩니다. (항상 활성화 — 모든 모드)
🧊 대화 고정
N번째 턴 이후, 턴 (N − 3) 이전의 모든 메시지를 캐시된 프리픽스로 고정합니다. 마지막 3 턴만 새로 전송됩니다. 절감 효과가 누적됩니다.
벤치마크
Sonnet을 사용한 실제 Claude Code 세션에서 측정했습니다. 턴 2에서 손익분기점에 도달합니다.
| Session type | Turns | Without caching | With caching | Savings |
|---|---|---|---|---|
| 버그 수정 (단일 파일) | 20 | 184 000 tokens | 28 400 tokens | 85 % |
| 리팩터 (5 파일) | 15 | 310 000 tokens | 61 200 tokens | 80 % |
| 일반 코딩 | 40 | 890 000 tokens | 71 200 tokens | 92 % |
| 반복 파일 읽기 (5 × 5) | — | 50 000 tokens | 5 100 tokens | 90 % |
캐시 생성 비용은 일반의 1.25×이며, 캐시 읽기 비용은 0.1×입니다. 첫 번째 턴 이후의 모든 턴은 순수한 절감 효과를 제공합니다.
prompt‑caching 설치
Claude Code (추천)
⏳ 공식 Claude Code 플러그인 마켓플레이스에서 승인을 기다리고 있습니다. 그 사이에 GitHub에서 직접 설치하세요:
/plugin marketplace add https://github.com/flightlesstux/prompt-caching
/plugin install prompt-caching@ercan-ermisClaude Code의 플러그인 시스템이 모든 작업을 자동으로 처리합니다. get_cache_stats 도구는 설치 직후 바로 사용할 수 있습니다.
npm을 통해 전역 설치
npm install -g prompt-caching-mcp클라이언트의 MCP 설정에 추가
{
"mcpServers": {
"prompt-caching-mcp": {
"command": "prompt-caching-mcp"
}
}
}지원되는 MCP 호환 클라이언트에는 Cursor, Windsurf, ChatGPT, Perplexity, Zed, Continue.dev 및 기타 모든 MCP 클라이언트가 포함됩니다.
오픈 소스 · MIT · 락인 없음
Claude Code 토큰 비용을 90% 절감할 준비가 되셨나요?