tokens는 이제 주니어보다 비싸고, 덜 예측 가능.
Source: Dev.to
많은 기업들이 아직도 스스로에게 하는 이야기:
“토큰은 저렴하다.”
나는 더 이상 그 이야기를 믿지 않는다. 토큰은 점점 불안정한 인건비 항목처럼 행동하고 있으며, 자유롭게 생산성을 높이는 것이 아니다. 점점 더 많은 워크플로우에서 토큰은 이미 기업들이 기꺼이 주니어 인력에게 지불할 의향이 있는 비용과 경쟁할 정도로 비싸다.
Public Pricing (as of 2024)
| Provider / Model | Input price (per 1 M tokens) | Output price (per 1 M tokens) |
|---|---|---|
| OpenAI GPT‑5.4 | $2.50 | $15 |
| Anthropic Claude Sonnet 4.6 | $3.00 | $15 |
| Google Gemini 2.5 Pro | $1.25 (≤ 200 k tokens) $2.50 (> 200 k tokens) | $10 (≤ 200 k tokens) $15 (> 200 k tokens) |
이 숫자들은 플레이그라운드에서 몇 개의 프롬프트만 실행할 경우 저렴해 보입니다.
10인 팀을 위한 대략적인 비용 스케치
좌석당 근무일 기준 가정
- 5 M 입력 토큰
- 2 M 출력 토큰
22 근무일 ≈ 1 개월.
| 제공자 / 모델 | 10석(10명)당 월 예상 비용 |
|---|---|
| OpenAI GPT‑5.4 | $9,350 |
| Anthropic Claude Sonnet 4.6 | $9,900 |
| Google Gemini 2.5 Pro | $7,150 – $9,350 (두 단계 가격을 반영한 범위) |
Gemini 범위는 단일 모델이 토큰 사용 패턴에 따라 “저렴함”과 “비쌈” 사이에서 어떻게 변동할 수 있는지를 보여줍니다.
급여와 비교했을 때
| 역할 (2024년 중위값) | 연봉 | 월급 |
|---|---|---|
| 행정 비서 (비서) | $47,460 | $3,955 |
| 소프트웨어 개발자 (중위값) | $133,080 | $11,090 |
| 소프트웨어 개발자 (10번째 백분위수) | $79,850 | $6,654 |
요약: 모델을 가볍게 활용하는 단일 엔지니어는 여전히 주니어 개발자보다 저렴하지만, 전사적인 AI 워크플로우는 주니어 인건비를 매우 빠르게 초과할 수 있습니다. 무거운 AI 좌석 5개만으로도 중위값 행정 비서의 월 비용을 이미 초과할 수 있습니다.
토큰 사용이 숨겨진 비용이 될 수 있는 이유
-
출력이 종종 비용이 많이 드는 절반 – OpenAI GPT‑5.4는 입력보다 출력에 6배 더 많은 비용을 청구합니다. “많은 컨텍스트를 보내는 것”에만 집중하는 팀은 청구서의 대부분을 놓치게 됩니다.
-
토크나이저 변경이 중요 – Anthropic은 Claude Opus 4.7의 새로운 토크나이저가 동일한 텍스트에 대해 최대 35 % 더 많은 토큰을 소비할 수 있다고 밝혔으며, 이는 작업량 변화 없이 비용 급증을 초래합니다.
-
계층형 가격 정책이 놀라움을 만든다 – Gemini 2.5 Pro는 200 k 토큰 이후에 요율을 전환합니다. 더 긴 프롬프트, 낮은 캐시 적중률, 혹은 추가 기능(예: grounding, 검색) 등이 청구서를 크게 바꿀 수 있습니다.
-
에이전트가 항목을 곱한다 – AI 에이전트를 사용할 경우 다음에 대한 비용을 지불합니다:
- 원본 프롬프트
- 도구 스키마 및 결과
- 사고 흐름(Chain‑of‑thought) 추론 예산(플랫폼에 따라 다름)
- 재시도, 파일 컨텍스트, 이전 턴 요약, 검토 패스, 자체 교정 루프 등
“에이전트가 작업을 8 분에 수행했다”는 말은 대시보드가 보여주는 것보다 더 흐릿한 한계 비용을 숨기고 있는 경우가 많습니다.
권고 사항 (지루한 일을 먼저 하라)
| Action | Why |
|---|---|
| 단일 귀여운 데모에만 벤치마크하지 말 것 | 일회성 테스트는 장기 비용 패턴을 숨깁니다. |
| 모델 능력을 작업에 맞추기 | 모든 작업이 최첨단 모델을 필요로 하는 것은 아닙니다. |
| 비싼 모델을 관리 대체제로 사용하는 것을 피하기 | 인간 감독은 여전히 가치를 더합니다. |
| 토큰 사용을 태그하고 모니터링하기 | 토큰 지출을 다른 예산 항목처럼 다루세요. |
| “AI vs human” 프레이밍을 신중히 적용하기 | 보다 나은 아키텍처와 정직한 경제성을 가져옵니다. |
| AI를 좋은 사람들을 증폭시키는 데 사용하고, 대체하지 않기 | 인간은 정확성, 비용, 결과에 대한 책임을 유지합니다. |
요약
- 토큰은 여전히 유용하지만, 이제는 귀여운 반올림 오차가 아닙니다.
- 많은 팀에게 토큰 사용 비용은 실제 노동과 인접한 예산 항목이 되고 있습니다.
- 토큰이 사람보다 마법처럼 저렴하다고 착각하지 마세요 – 토큰은 발밑에서 변할 수 있는 청구 모델, 사용 패턴에 따라 비용이 폭발할 수 있는 비용 프로필, 그리고 저렴해 보이다가 갑자기 그렇지 않게 되는 성향을 가지고 있습니다.
내 기본 입장:
AI를 적극적으로 활용하되, 토큰 예산이 성인 감독 없이 운영되지 않도록 하세요.
참고 문헌
- OpenAI, API 가격 – https://openai.com/pricing
- Anthropic, Claude 가격 – https://www.anthropic.com/pricing
- Google, Gemini 개발자 API 가격 – https://cloud.google.com/vertex-ai/generative-ai/pricing
- U.S. Bureau of Labor Statistics, 소프트웨어 개발자, 품질 보증 분석가 및 테스터 – https://www.bls.gov/oes/current/oes151132.htm
- U.S. Bureau of Labor Statistics, 비서 및 행정 보조원 – https://www.bls.gov/oes/current/oes43-3000.htm