OpenClaw와 함께 첫날에 토큰 $250을 소진했습니다. 이유는 이렇습니다.
Source: Dev.to
Overview

프로덕션 트래픽도, 고객도 없습니다. 그냥 몇 가지 간단한 워크플로우를 테스트하고 있을 뿐이죠.
문제의 원인은 하나의 큰 요청이 아니라 네 가지가 복합적으로 작용했기 때문입니다:
- 컨텍스트 누적. 프롬프트에 “한 가지 더”를 계속 추가했습니다—이전 결정, 더 많은 컨텍스트, 그리고 더 자세한 내용. 각 실행이 점점 커졌지만, 크게 느껴지지는 않았습니다.
- 도구 출력 팽창. 로그, diff, API 응답이 바로 다음 단계로 흐르는 구조. 출력이 입력이 되고 다시 출력이 됩니다. 금방 누적됩니다.
- 예약 작업 오버헤드. 크론 작업이 매 실행마다 큰 프롬프트 풋프린트를 재구성합니다. 재앙은 아니지만, 조용히 반복적으로 비용이 많이 듭니다.
- 중복 트리거. 몇 번의 재시도로 같은 부풀린 작업을 두 번 실행했습니다.
해결책은 다소 지루했습니다: 컨텍스트 윈도우를 작게 유지하고, 도구 출력을 과감히 다듬으며, 예약 작업마다 새로운 세션 경계를 만들고, 가장 중요한 것은 기본 모델을 가장 비싼 모델로 사용하지 않도록 하는 것이었습니다. 마지막 조치만으로도 대부분의 비용을 절감할 수 있었습니다.
잠시 후 모델 전환이 지겨워져서 이를 연구 기회로 바꾸기로 했습니다. GitHub에 RoBC를 공개하고, 이를 학습시킨 뒤 clawpane.co에 배포했습니다.
레포를 확인하시거나 AI 비용 관리에 도움이 필요하시면 알려 주세요.