tokens는 이제 주니어보다 비싸고, 덜 예측 가능.

발행: (2026년 5월 1일 PM 06:05 GMT+9)
8 분 소요
원문: Dev.to

Source: Dev.to

많은 기업들이 아직도 스스로에게 하는 이야기:

“토큰은 저렴하다.”

나는 더 이상 그 이야기를 믿지 않는다. 토큰은 점점 불안정한 인건비 항목처럼 행동하고 있으며, 자유롭게 생산성을 높이는 것이 아니다. 점점 더 많은 워크플로우에서 토큰은 이미 기업들이 기꺼이 주니어 인력에게 지불할 의향이 있는 비용과 경쟁할 정도로 비싸다.

Public Pricing (as of 2024)

Provider / ModelInput price (per 1 M tokens)Output price (per 1 M tokens)
OpenAI GPT‑5.4$2.50$15
Anthropic Claude Sonnet 4.6$3.00$15
Google Gemini 2.5 Pro$1.25 (≤ 200 k tokens)
$2.50 (> 200 k tokens)
$10 (≤ 200 k tokens)
$15 (> 200 k tokens)

이 숫자들은 플레이그라운드에서 몇 개의 프롬프트만 실행할 경우 저렴해 보입니다.

10인 팀을 위한 대략적인 비용 스케치

좌석당 근무일 기준 가정

  • 5 M 입력 토큰
  • 2 M 출력 토큰

22 근무일 ≈ 1 개월.

제공자 / 모델10석(10명)당 월 예상 비용
OpenAI GPT‑5.4$9,350
Anthropic Claude Sonnet 4.6$9,900
Google Gemini 2.5 Pro$7,150 – $9,350 (두 단계 가격을 반영한 범위)

Gemini 범위는 단일 모델이 토큰 사용 패턴에 따라 “저렴함”과 “비쌈” 사이에서 어떻게 변동할 수 있는지를 보여줍니다.

급여와 비교했을 때

역할 (2024년 중위값)연봉월급
행정 비서 (비서)$47,460$3,955
소프트웨어 개발자 (중위값)$133,080$11,090
소프트웨어 개발자 (10번째 백분위수)$79,850$6,654

요약: 모델을 가볍게 활용하는 단일 엔지니어는 여전히 주니어 개발자보다 저렴하지만, 전사적인 AI 워크플로우는 주니어 인건비를 매우 빠르게 초과할 수 있습니다. 무거운 AI 좌석 5개만으로도 중위값 행정 비서의 월 비용을 이미 초과할 수 있습니다.

토큰 사용이 숨겨진 비용이 될 수 있는 이유

  1. 출력이 종종 비용이 많이 드는 절반 – OpenAI GPT‑5.4는 입력보다 출력에 6배 더 많은 비용을 청구합니다. “많은 컨텍스트를 보내는 것”에만 집중하는 팀은 청구서의 대부분을 놓치게 됩니다.

  2. 토크나이저 변경이 중요 – Anthropic은 Claude Opus 4.7의 새로운 토크나이저가 동일한 텍스트에 대해 최대 35 % 더 많은 토큰을 소비할 수 있다고 밝혔으며, 이는 작업량 변화 없이 비용 급증을 초래합니다.

  3. 계층형 가격 정책이 놀라움을 만든다 – Gemini 2.5 Pro는 200 k 토큰 이후에 요율을 전환합니다. 더 긴 프롬프트, 낮은 캐시 적중률, 혹은 추가 기능(예: grounding, 검색) 등이 청구서를 크게 바꿀 수 있습니다.

  4. 에이전트가 항목을 곱한다 – AI 에이전트를 사용할 경우 다음에 대한 비용을 지불합니다:

    • 원본 프롬프트
    • 도구 스키마 및 결과
    • 사고 흐름(Chain‑of‑thought) 추론 예산(플랫폼에 따라 다름)
    • 재시도, 파일 컨텍스트, 이전 턴 요약, 검토 패스, 자체 교정 루프 등

    “에이전트가 작업을 8 분에 수행했다”는 말은 대시보드가 보여주는 것보다 더 흐릿한 한계 비용을 숨기고 있는 경우가 많습니다.

권고 사항 (지루한 일을 먼저 하라)

ActionWhy
단일 귀여운 데모에만 벤치마크하지 말 것일회성 테스트는 장기 비용 패턴을 숨깁니다.
모델 능력을 작업에 맞추기모든 작업이 최첨단 모델을 필요로 하는 것은 아닙니다.
비싼 모델을 관리 대체제로 사용하는 것을 피하기인간 감독은 여전히 가치를 더합니다.
토큰 사용을 태그하고 모니터링하기토큰 지출을 다른 예산 항목처럼 다루세요.
“AI vs human” 프레이밍을 신중히 적용하기보다 나은 아키텍처와 정직한 경제성을 가져옵니다.
AI를 좋은 사람들을 증폭시키는 데 사용하고, 대체하지 않기인간은 정확성, 비용, 결과에 대한 책임을 유지합니다.

요약

  • 토큰은 여전히 유용하지만, 이제는 귀여운 반올림 오차가 아닙니다.
  • 많은 팀에게 토큰 사용 비용은 실제 노동과 인접한 예산 항목이 되고 있습니다.
  • 토큰이 사람보다 마법처럼 저렴하다고 착각하지 마세요 – 토큰은 발밑에서 변할 수 있는 청구 모델, 사용 패턴에 따라 비용이 폭발할 수 있는 비용 프로필, 그리고 저렴해 보이다가 갑자기 그렇지 않게 되는 성향을 가지고 있습니다.

내 기본 입장:

AI를 적극적으로 활용하되, 토큰 예산이 성인 감독 없이 운영되지 않도록 하세요.

참고 문헌

0 조회
Back to Blog

관련 글

더 보기 »

Dutch용 런칭; 파트 1: 콘텐츠

배경: 저는 배우고 있는 언어가 스웨덴어라서 LangBear를 스웨덴어용으로 출시했습니다. 하지만 지금까지 단 한 명의 고객도 확보하지 못했습니다—neithe...