이 오픈 소스 도구로 내 Claude 코드 토큰 사용량을 94% 줄였습니다

발행: (2026년 5월 8일 AM 04:33 GMT+9)
5 분 소요
원문: Dev.to

Source: Dev.to

The Problem

입력 토큰이 Claude Code 비용의 85‑95%를 차지합니다. 결제 흐름에 대해 Claude에게 물어볼 때마다 payments.py, shipping.py 그리고 관련될 것 같은 모든 파일을 읽습니다. 이는 800 토큰 정도의 컨텍스트만 필요할 질문에 대해 45,000 토큰을 소비하는 셈이죠.

Without CCE:    Claude reads payments.py + shipping.py   = 45,000 tokens
With CCE:       context_search "payment flow"            =    800 tokens

How It Works

CCE는 로컬 MCP 서버로 동작합니다. 설정은 세 줄이면 충분합니다:

uv tool install code-context-engine
cd /path/to/your/project
cce init

그게 전부입니다. 클라우드도, 별도 설정도 필요 없습니다. cce init은 편집기(Claude Code, VS Code, Cursor, Gemini CLI, Codex, OpenCode)를 자동으로 감지하고 올바른 설정을 작성합니다.

Under the hood

  • Tree‑sitter 가 코드를 의미론적 청크(함수, 클래스, 모듈)로 파싱합니다
  • Hybrid retrieval 가 벡터 유사도와 BM25 키워드 매칭을 결합합니다
  • Graph expansion 이 CALLS/IMPORTS 엣지를 따라 관련 코드를 끌어옵니다
  • Compression 이 청크를 시그니처와 docstring 으로 압축합니다
  • Memory 가 세션 간 결정과 코드 영역을 지속합니다

편집 후 재인덱싱은 1초 미만(96 % 임베딩 캐시 적중률) 걸립니다. Git 훅이 인덱스를 자동으로 최신 상태로 유지합니다.

The Benchmark

우리는 FastAPI (소스 파일 53개, 180 K 토큰)를 대상으로 20개의 실제 코딩 질문을 사용해 벤치마크했습니다. cherry‑picking은 하지 않았습니다.

MetricResult
Retrieval savings94 % (83,681 → 4,927 tokens/query)
Compression (additional)89 %
Recall@100.90
Latency p500.4 ms

Important: 94 % 절감율은 전체 파일 읽기와 비교한 값이며, Claude Code의 내장 탐색과는 비교하지 않았습니다. 재현 가능하고 결정적인 기준을 위해 전체 파일을 기준으로 삼았습니다. 전체 방법론은 여기서 확인하세요.

직접 재현하려면 다음을 실행하세요:

pip install code-context-engine
python benchmarks/run_benchmark.py --repo https://github.com/fastapi/fastapi.git --source-dir fastapi

What You Get

Claude가 자동으로 활용하는 9개의 MCP 도구:

  • context_search – 하이브리드 벡터 + BM25 검색
  • session_recallrecord_decision – 세션 간 메모리
  • related_context – 코드 그래프 탐색
  • set_output_compression – 응답 길이 제어
  • expand_chunk, record_code_area, index_status, reindex

토큰 절감량, 도넛 차트, 세션 히스토리를 보여주는 실시간 대시보드:

cce dashboard

실시간 Anthropic 가격을 기반으로 한 달러 추정치:

cce savings --all

Why Not Just Use Cursor’s Built‑in Indexing?

CCE는 편집기와 무관합니다. 하나의 인덱스로 Claude Code, VS Code, Cursor, Gemini CLI, Codex 모두에서 사용할 수 있습니다. 코드는 절대로 외부로 나가지 않으며, 실제 달러 금액으로 측정 가능한 절감 효과를 제공합니다.

Languages Supported

Python, JavaScript, TypeScript, PHP, Go, Rust, Java에 대한 AST‑aware 청크링을 지원합니다. 40개 이상의 언어(C, C++, Swift, Kotlin, Ruby, Haskell 등)에 대한 언어‑인식 폴백도 제공합니다. 모든 텍스트 파일이 인덱싱됩니다.

Try It

uv tool install code-context-engine
cd your-project
cce init

세 줄이면 됩니다. 60초 안에 절감 효과를 확인해 보세요.

GitHub | Docs | Benchmark

CCE는 MIT 라이선스로 제공되는 무료 오픈 소스 프로젝트이며, Elara Labs에서 개발했습니다.

0 조회
Back to Blog

관련 글

더 보기 »

LLM RPG 테스트 2026

프롬프트: 역할‑플레이 게임 스토리텔러처럼 행동하고, 스타일은 약간 비꼬는 듯 해야 합니다. 모험 뒤에는 도전과 음모가 있어야 합니다, don'

ChatGPT Futures 소개: 2026학번

2026학번은 ChatGPT와 함께 대학에 입학하고 졸업하는 최초의 세대이다. 그들은 2022년 가을에 캠퍼스에 도착했으며, AI가 본격적으로 재편되기 시작하던 시점이었다.