프롬프트 캐싱 – Anthropic 캐시 브레이크포인트를 자동 삽입 (90% 토큰 절감)

발행: (2026년 3월 13일 오후 08:38 GMT+9)
4 분 소요
원문: Hacker News

Source: Hacker News

MCP 플러그인 · 오픈 소스 · MIT
Claude와 함께, Claude를 위해 구축되었습니다.

프롬프트 캐싱 작동 방식

Anthropic의 캐싱 API는 안정적인 콘텐츠를 서버 측에 5분 동안 저장합니다. 캐시 읽기 비용은 **0.1×**이며, 기존 1× 대비 절감됩니다. 이 플러그인은 자동으로 중단점을 배치합니다.

🐛 BugFix 모드

메시지에서 스택 트레이스를 감지합니다. 버그가 있는 파일 + 오류 컨텍스트를 한 번 캐시합니다. 이후의 모든 후속 질문은 새로운 질문에 대해서만 비용이 청구됩니다.

♻️ Refactor 모드

리팩터 키워드 + 파일 목록을 감지합니다. 이전 패턴, 스타일 가이드, 타입 정의를 캐시합니다. 파일별 지시사항만 다시 전송됩니다.

📂 파일 추적

파일별 읽기 횟수를 추적합니다. 두 번째 읽기 시 캐시 중단점을 삽입합니다. 이후 모든 읽기 비용은 0.1×이며, 기존 1× 대비 절감됩니다. (항상 활성화 — 모든 모드)

🧊 대화 고정

N번째 턴 이후, 턴 (N − 3) 이전의 모든 메시지를 캐시된 프리픽스로 고정합니다. 마지막 3 턴만 새로 전송됩니다. 절감 효과가 누적됩니다.

벤치마크

Sonnet을 사용한 실제 Claude Code 세션에서 측정했습니다. 턴 2에서 손익분기점에 도달합니다.

Session typeTurnsWithout cachingWith cachingSavings
버그 수정 (단일 파일)20184 000 tokens28 400 tokens85 %
리팩터 (5 파일)15310 000 tokens61 200 tokens80 %
일반 코딩40890 000 tokens71 200 tokens92 %
반복 파일 읽기 (5 × 5)50 000 tokens5 100 tokens90 %

캐시 생성 비용은 일반의 1.25×이며, 캐시 읽기 비용은 0.1×입니다. 첫 번째 턴 이후의 모든 턴은 순수한 절감 효과를 제공합니다.

prompt‑caching 설치

Claude Code (추천)

⏳ 공식 Claude Code 플러그인 마켓플레이스에서 승인을 기다리고 있습니다. 그 사이에 GitHub에서 직접 설치하세요:

/plugin marketplace add https://github.com/flightlesstux/prompt-caching
/plugin install prompt-caching@ercan-ermis

Claude Code의 플러그인 시스템이 모든 작업을 자동으로 처리합니다. get_cache_stats 도구는 설치 직후 바로 사용할 수 있습니다.

npm을 통해 전역 설치

npm install -g prompt-caching-mcp

클라이언트의 MCP 설정에 추가

{
  "mcpServers": {
    "prompt-caching-mcp": {
      "command": "prompt-caching-mcp"
    }
  }
}

지원되는 MCP 호환 클라이언트에는 Cursor, Windsurf, ChatGPT, Perplexity, Zed, Continue.dev 및 기타 모든 MCP 클라이언트가 포함됩니다.


오픈 소스 · MIT · 락인 없음

Claude Code 토큰 비용을 90% 절감할 준비가 되셨나요?

0 조회
Back to Blog

관련 글

더 보기 »

Claude 2026년 3월 사용 촉진

우리는 제한된 기간 동안 8 AM‑2 PM ET / 5‑11 AM PT를 제외한 시간대에 Claude 사용자의 사용 제한을 두 배로 늘리는 프로모션을 제공하고 있습니다. 이 프로모션은 Free, Pro,…