이 오픈 소스 도구로 내 Claude 코드 토큰 사용량을 94% 줄였습니다

발행: 20시간 전 (2026년 5월 8일 AM 04:33 GMT+9)

5 분 소요

Source: Dev.to

The Problem

입력 토큰이 Claude Code 비용의 85‑95%를 차지합니다. 결제 흐름에 대해 Claude에게 물어볼 때마다 payments.py, shipping.py 그리고 관련될 것 같은 모든 파일을 읽습니다. 이는 800 토큰 정도의 컨텍스트만 필요할 질문에 대해 45,000 토큰을 소비하는 셈이죠.

Without CCE:    Claude reads payments.py + shipping.py   = 45,000 tokens
With CCE:       context_search "payment flow"            =    800 tokens

How It Works

CCE는 로컬 MCP 서버로 동작합니다. 설정은 세 줄이면 충분합니다:

uv tool install code-context-engine
cd /path/to/your/project
cce init

그게 전부입니다. 클라우드도, 별도 설정도 필요 없습니다. cce init은 편집기(Claude Code, VS Code, Cursor, Gemini CLI, Codex, OpenCode)를 자동으로 감지하고 올바른 설정을 작성합니다.

Under the hood

Tree‑sitter 가 코드를 의미론적 청크(함수, 클래스, 모듈)로 파싱합니다
Hybrid retrieval 가 벡터 유사도와 BM25 키워드 매칭을 결합합니다
Graph expansion 이 CALLS/IMPORTS 엣지를 따라 관련 코드를 끌어옵니다
Compression 이 청크를 시그니처와 docstring 으로 압축합니다
Memory 가 세션 간 결정과 코드 영역을 지속합니다

편집 후 재인덱싱은 1초 미만(96 % 임베딩 캐시 적중률) 걸립니다. Git 훅이 인덱스를 자동으로 최신 상태로 유지합니다.

The Benchmark

우리는 FastAPI (소스 파일 53개, 180 K 토큰)를 대상으로 20개의 실제 코딩 질문을 사용해 벤치마크했습니다. cherry‑picking은 하지 않았습니다.

Metric	Result
Retrieval savings	94 % (83,681 → 4,927 tokens/query)
Compression (additional)	89 %
Recall@10	0.90
Latency p50	0.4 ms

Important: 94 % 절감율은 전체 파일 읽기와 비교한 값이며, Claude Code의 내장 탐색과는 비교하지 않았습니다. 재현 가능하고 결정적인 기준을 위해 전체 파일을 기준으로 삼았습니다. 전체 방법론은 여기서 확인하세요.

직접 재현하려면 다음을 실행하세요:

pip install code-context-engine
python benchmarks/run_benchmark.py --repo https://github.com/fastapi/fastapi.git --source-dir fastapi

What You Get

Claude가 자동으로 활용하는 9개의 MCP 도구:

context_search – 하이브리드 벡터 + BM25 검색
session_recall 및 record_decision – 세션 간 메모리
related_context – 코드 그래프 탐색
set_output_compression – 응답 길이 제어
expand_chunk, record_code_area, index_status, reindex

토큰 절감량, 도넛 차트, 세션 히스토리를 보여주는 실시간 대시보드:

cce dashboard

실시간 Anthropic 가격을 기반으로 한 달러 추정치:

cce savings --all

Why Not Just Use Cursor’s Built‑in Indexing?

CCE는 편집기와 무관합니다. 하나의 인덱스로 Claude Code, VS Code, Cursor, Gemini CLI, Codex 모두에서 사용할 수 있습니다. 코드는 절대로 외부로 나가지 않으며, 실제 달러 금액으로 측정 가능한 절감 효과를 제공합니다.

Languages Supported

Python, JavaScript, TypeScript, PHP, Go, Rust, Java에 대한 AST‑aware 청크링을 지원합니다. 40개 이상의 언어(C, C++, Swift, Kotlin, Ruby, Haskell 등)에 대한 언어‑인식 폴백도 제공합니다. 모든 텍스트 파일이 인덱싱됩니다.

Try It

uv tool install code-context-engine
cd your-project
cce init

세 줄이면 됩니다. 60초 안에 절감 효과를 확인해 보세요.

GitHub | Docs | Benchmark

CCE는 MIT 라이선스로 제공되는 무료 오픈 소스 프로젝트이며, Elara Labs에서 개발했습니다.

이 오픈 소스 도구로 내 Claude 코드 토큰 사용량을 94% 줄였습니다

The Problem

How It Works

Under the hood

The Benchmark

What You Get

Why Not Just Use Cursor’s Built‑in Indexing?

Languages Supported

Try It

관련 글

OpenAI는 말할 때 추론하고 번역하며 전사하는 새로운 음성 모델을 선보인다

LLM RPG 테스트 2026

ChatGPT Futures 소개: 2026학번

귀하의 API는 llms.txt 파일이 필요합니다 — 작성 방법과 Agents가 이를 읽는 이유