AI 코딩 비용을 패치당 측정하기 위해 TokenPatch를 만들었다
출처: Dev.to
AI 코딩 도구가 점점 더 유용해지고 있지만, 나는 한 가지 문제에 계속 부딪혔습니다.
비싼 최첨단 모델이 작은 파일 범위의 구현 패치까지도 모두 처리하는 데 사용됩니다.
그것은 낭비처럼 느껴집니다.
많은 코딩 작업에서 강력한 모델은 계획과 판단을 담당하길 원하지만, 모든 세부적인 diff를 작성하도록 할 필요는 없습니다.
그래서 나는 TokenPatch를 만들었습니다.
GitHub: https://github.com/Leoyen1/tokenpatch
Website: https://tokenpatch.com
TokenPatch를 사용하면 현재 사용 중인 AI 코딩 도구(Codex, Claude Code, Cursor, 혹은 MCP 지원 코딩 에이전트 등)를 그대로 유지할 수 있습니다.
강력한 모델이 무엇을 바꿔야 할지 여전히 결정하고, TokenPatch는 제한된 구현 작업을 더 저렴한 실행기로 라우팅한 뒤, 패치를 로컬에서 확인하고 실제 유용한 변경에 든 비용을 보고합니다.
핵심 지표는 적용된 패치당 비용이며, 단순히 요청 비용만 보는 것이 아닙니다.
예시 작업은 다음과 같습니다.
tp: 페이지 제목을 변경합니다. index.html만 수정합니다.
보고서는 다음과 같이 표시될 수 있습니다.
Task: 페이지 제목을 변경, index.html만 수정
왜 만들었는가
대부분의 LLM 비용 도구는 API 요청에만 초점을 맞춥니다.
하지만 에이전트를 이용해 코딩할 때는 작업 수준의 경제성이 더 중요합니다.
- 패치가 실제로 적용되었는가?
- 허용된 파일 범위 내에 머물렀는가?
- 검증을 통과했는가?
- 승인된 변경에 얼마나 비용이 들었는가?
- 모든 작업을 강력한 모델에 맡겼다면 비용이 더 많이 들었을까?
이러한 레이어를 탐구하고 싶었습니다.
현재 상황
TokenPatch는 오픈 소스이며 BYOK(Bring Your Own Key) 방식을 우선합니다.
사용자는 현재 DeepSeek와 호환되는 자체 실행기 API 키를 제공하면, TokenPatch가 로컬에서 동작합니다.
GitHub에서 설치합니다:
pip install git+https://github.com/Leoyen1/tokenpatch.git
그런 다음 코딩 앱에서 다음과 같이 사용합니다:
tp: 작은 변경을 구현합니다. <파일>만 수정합니다.
제가 찾고 있는 것
아직 초기 단계입니다.
AI 코딩 도구를 정기적으로 사용하는 개발자들의 피드백을 원합니다:
- “적용된 패치당 비용”이 유용한 지표인가?
- 설정 과정이 너무 복잡한가?
- 파일 경계가 강제된다면 더 저렴한 실행기를 신뢰할 수 있는가?
- 다음에 지원해야 할 코딩 에이전트 워크플로우는 무엇인가?
시도해 보신다면 GitHub에 피드백이나 이슈를 남겨 주시면 정말 감사하겠습니다.