이 오픈 소스 도구로 내 Claude 코드 토큰 사용량을 94% 줄였습니다
Source: Dev.to
The Problem
입력 토큰이 Claude Code 비용의 85‑95%를 차지합니다. 결제 흐름에 대해 Claude에게 물어볼 때마다 payments.py, shipping.py 그리고 관련될 것 같은 모든 파일을 읽습니다. 이는 800 토큰 정도의 컨텍스트만 필요할 질문에 대해 45,000 토큰을 소비하는 셈이죠.
Without CCE: Claude reads payments.py + shipping.py = 45,000 tokens
With CCE: context_search "payment flow" = 800 tokens
How It Works
CCE는 로컬 MCP 서버로 동작합니다. 설정은 세 줄이면 충분합니다:
uv tool install code-context-engine
cd /path/to/your/project
cce init
그게 전부입니다. 클라우드도, 별도 설정도 필요 없습니다. cce init은 편집기(Claude Code, VS Code, Cursor, Gemini CLI, Codex, OpenCode)를 자동으로 감지하고 올바른 설정을 작성합니다.
Under the hood
- Tree‑sitter 가 코드를 의미론적 청크(함수, 클래스, 모듈)로 파싱합니다
- Hybrid retrieval 가 벡터 유사도와 BM25 키워드 매칭을 결합합니다
- Graph expansion 이 CALLS/IMPORTS 엣지를 따라 관련 코드를 끌어옵니다
- Compression 이 청크를 시그니처와 docstring 으로 압축합니다
- Memory 가 세션 간 결정과 코드 영역을 지속합니다
편집 후 재인덱싱은 1초 미만(96 % 임베딩 캐시 적중률) 걸립니다. Git 훅이 인덱스를 자동으로 최신 상태로 유지합니다.
The Benchmark
우리는 FastAPI (소스 파일 53개, 180 K 토큰)를 대상으로 20개의 실제 코딩 질문을 사용해 벤치마크했습니다. cherry‑picking은 하지 않았습니다.
| Metric | Result |
|---|---|
| Retrieval savings | 94 % (83,681 → 4,927 tokens/query) |
| Compression (additional) | 89 % |
| Recall@10 | 0.90 |
| Latency p50 | 0.4 ms |
Important: 94 % 절감율은 전체 파일 읽기와 비교한 값이며, Claude Code의 내장 탐색과는 비교하지 않았습니다. 재현 가능하고 결정적인 기준을 위해 전체 파일을 기준으로 삼았습니다. 전체 방법론은 여기서 확인하세요.
직접 재현하려면 다음을 실행하세요:
pip install code-context-engine
python benchmarks/run_benchmark.py --repo https://github.com/fastapi/fastapi.git --source-dir fastapi
What You Get
Claude가 자동으로 활용하는 9개의 MCP 도구:
context_search– 하이브리드 벡터 + BM25 검색session_recall및record_decision– 세션 간 메모리related_context– 코드 그래프 탐색set_output_compression– 응답 길이 제어expand_chunk,record_code_area,index_status,reindex
토큰 절감량, 도넛 차트, 세션 히스토리를 보여주는 실시간 대시보드:
cce dashboard
실시간 Anthropic 가격을 기반으로 한 달러 추정치:
cce savings --all
Why Not Just Use Cursor’s Built‑in Indexing?
CCE는 편집기와 무관합니다. 하나의 인덱스로 Claude Code, VS Code, Cursor, Gemini CLI, Codex 모두에서 사용할 수 있습니다. 코드는 절대로 외부로 나가지 않으며, 실제 달러 금액으로 측정 가능한 절감 효과를 제공합니다.
Languages Supported
Python, JavaScript, TypeScript, PHP, Go, Rust, Java에 대한 AST‑aware 청크링을 지원합니다. 40개 이상의 언어(C, C++, Swift, Kotlin, Ruby, Haskell 등)에 대한 언어‑인식 폴백도 제공합니다. 모든 텍스트 파일이 인덱싱됩니다.
Try It
uv tool install code-context-engine
cd your-project
cce init
세 줄이면 됩니다. 60초 안에 절감 효과를 확인해 보세요.
CCE는 MIT 라이선스로 제공되는 무료 오픈 소스 프로젝트이며, Elara Labs에서 개발했습니다.