Claude Fable 5 vs Opus 4.8: 두 배 가격, 그만한 가치가 있을까?

발행: (2026년 6월 10일 PM 04:06 GMT+9)
12 분 소요
원문: Dev.to

Source: Dev.to

Fable 5는 입력 토큰 백만 개당 10 달러이며 Opus 4.8은 5 달러, 출력은 각각 50 대 25 입니다.

SWE‑Bench Pro 격차는 11.1 점이고, FrontierCode는 13.4 대 29.3 으로 두 배 이상 차이납니다.

API 표면은 동일하지만 새로운 400이 하나 추가되었습니다: Fable 5에서는 thinking: {"type": "disabled"} 를 명시하면 거부됩니다. 필드를 생략하세요.

캐시 최소값이 Fable 5에서는 2048 토큰으로 낮아졌고, Opus 4.8은 최소 4096 토큰이 필요합니다.

내 라우팅: 장시간 자동 실행 및 연구에는 Fable 5, 일상적인 작업에는 Opus 4.8을 기본값으로 사용합니다.


동일한 요청 형태에 두 배 가격이 붙습니다. 이것이 논문상 Claude Fable 5의 조건이며, 모델을 비싼 장식품으로 치부하기 쉽습니다. 저는 6월 9일 출시 이후 Fable 5와 Opus 4.8을 나란히 실행해 왔으며, 차이는 예상보다 명확했습니다. 제가 첫날 원했던 비교는 바로 이였습니다: 수치, 코드 차이, 그리고 실제로 채택한 라우팅 규칙.

시작: 두 배가 된 것과 그렇지 않은 것

Benchmark

  • SWE‑Bench Pro (실제 GitHub 작업)
  • FrontierCode (프로덕션 수준)
  • Core Analytics
  • 일상적인 스프레드시트 스위트

패턴이 단일 행보다 중요합니다. 포화된 작업에서는 격차가 작습니다: Anthropic 자체 ViBench 수치는 표준 vibe‑coding 요청이 거의 한계에 도달했으며 Opus 4.8이 이미 원샷으로 처리합니다. 어려운 작업에서는 격차가 폭발합니다. FrontierCode가 이를 가장 잘 보여줍니다. 13.4 → 29.3은 단순 증가가 아니라 새로운 작업 티어가 해결 가능해졌다는 의미입니다.

두 가지 비코딩 결과가 저를 움직였습니다.

  • Slay the Spire 장기 실행에서는 지속 메모리가 Fable 5에 세 배 더 큰 도움이 되었고, 최종 챕터에 도달한 비율도 세 배였습니다. 이는 장기 일관성 이야기를 축소한 형태로, 모델이 자체 메모리를 더 잘 활용한다는 뜻입니다.
  • Hebbia 금융 벤치마크와 문서 추론에서는 Fable 5가 가장 높은 점수를 기록했으며, 이는 제가 PDF 추출 작업에서 체감한 바와 일치합니다. 장기 추론에 특화된 FrontierBench에서도 Fable 5가 1위를 차지했습니다.

기준선은 Opus 4.8 릴리즈를 기준으로 했으며, 이는 Claude Opus 4.8 Is Here: Everything That Changed에서 상세히 다루었습니다. 그 글이 찬양한 모든 점은 여전히 유효합니다. Fable 5는 Opus 4.8을 악화시키는 것이 아니라, 제 작업 큐 중 가장 어려운 20 %를 가능하게 합니다.

마이그레이션은 한 줄

모델 ID는 claude-fable-5이며, Fable 5는 Opus 4.7·4.8과 동일한 요청 표면을 유지합니다: thinking: {"type": "adaptive"} 로 적응형 사고, 온도·top_p·top_k는 모두 400을 반환, budget_tokens 없음, final-assistant-turn 프리필 없음, 노력 수준은 low → high → xhigh 까지 최대치까지 지원합니다.

놓치면 안 될 세 가지 차이점

  1. 새로운 400
    thinking: {"type": "disabled"} 를 명시하면 Fable 5에서는 거부됩니다. Opus 4.8은 이를 허용하므로, 사고를 비활성화하고 싶다면 해당 필드를 완전히 생략하세요. 기본값으로 disabled를 설정하는 공유 요청 빌더가 있다면 Opus에서는 통과하지만 Fable에서는 실패합니다.

  2. 프롬프트 캐시 최소값
    Fable 5는 2048 토큰부터 프리픽스를 캐시하지만, Opus 4.8은 4096 토큰이 필요합니다. 3 000 토큰짜리 시스템 프롬프트는 Opus 4.8에서는 절대 캐시되지 않지만 Fable 5에서는 정상적으로 캐시됩니다. 입력 토큰 백만 개당 10 달러라면, 캐시 읽기는 기본 가격의 약 1/10 수준이므로, 짧은 프롬프트 작업에서 가격 격차를 은연히 완화합니다.

  3. Fast Mode
    Claude Code의 Fast Mode는 현재 Opus 전용입니다. 빠른 반복을 위해 Fast Mode에 익숙하다면, 아직 Fable 5에서는 해당 레버가 존재하지 않습니다.

컨텍스트 윈도우와 출력 상한은 동일합니다: 입력 1 백만 토큰, 출력 최대 128 K(스트리밍 지원). 압축, 구조화 출력, 작업 예산도 그대로 이어집니다.

첫날 비용을 절감하는 튜닝 팁

노력 수준이 이 티어에서는 더 중요합니다. 저는 에이전트 코딩에 xhigh를 사용하고(Claude Code 기본값이기도 함), 그 외에는 high로 낮춥니다. 프리미엄 모델을 무조건 최고 수준으로 돌리는 것은 오히려 비효율적입니다. 과도한 사고는 일상 작업을 과잉 생각하게 만들고, Fable 5에서는 그 과잉 사고 토큰당 50 달러가 추가됩니다. 자신의 워크로드에 대해 medium, high, xhigh를 모두 시험해 본 뒤 결정하세요.

가격을 토큰당으로 평가하는 것은 에이전시 작업에 맞지 않습니다. 해결된 작업당 가격이 올바른 프레임이며, 이 계산은 빠르게 뒤집힙니다.

구체적인 사례

Opus 4.8이 3번 시도(두 번 실패, 한 번 성공)해야 했던 리팩터링 작업은 약 600 K 출력 토큰을 소모했으며, 비용은 약 15 달러였습니다. 동일 작업을 Fable 5가 한 번에 처리했을 때는 130 K 출력 토큰, 비용은 약 6.50 달러였습니다. 즉, 비싼 모델이 실제로는 더 저렴했습니다. 재시도 비용이 에이전시 예산을 좌우하기 때문입니다. Stripe의 출시일 예시도 같은 원리로, 수천만 라인 Ruby 마이그레이션을 하루에 압축했습니다.

라우팅 규칙

  1. 장기·자동 작업 → Fable 5
    밤새 실행되는 작업, 여러 시간 걸리는 리팩터, 사양을 한 번 작성하고 떠날 수 있는 작업 등. Slay the Spire 메모리 결과는 실무에서도 동일하게 나타납니다.

  2. 연구형 작업 → Fable 5
    블라인드 비교에서 분자생물학 가설이 Opus급 출력보다 80 % 이상 선호되었고, 내부 약물 설계는 약 10배 빠르게 진행되었습니다. 여기서는 경쟁적인 해부와 밀집 문서 분석이 해당됩니다.

  3. 시각 중심 작업 → Fable 5
    스크린샷으로부터 앱 소스 재구성, 차트 이미지에서 정확한 값 추출 등 모두 테스트에서 성공했으며, 벤치마크도 이를 뒷받침합니다.

작업이 충분히 어려워 재시도가 필요하다면, 보통 Fable 5가 예산 선택입니다.

변하지 않은 부분

대량·일상 작업은 Opus 4.8에 남겨 둡니다. 자동 퍼블리시 파이프라인, 커밋 요약, 콘텐츠 초안 등 기존 모델이 이미 원샷으로 안정적으로 처리하는 경우입니다. 100 % 첫 시도 성공률을 가진 작업에 두 배 비용을 지불해도 이득이 없습니다. Opus, Sonnet, Haiku 간 라우팅 로직은 [Opus 4.8 vs Sonnet vs Haiku: How I Route Work in 2026] 이후로 변하지 않았으며, Fable 5는 그 위에 한 단계만 추가된 셈입니다.

보안 관련 작업은 특이합니다. Fable 5는 사이버 보안 요청(취약점 탐색, 익스플로잇 분석, 공격 계획)을 내부 분류기로 Opus 4.8에 전달합니다. 전체 세션 중 5 % 미만에서만 분류기가 작동하지만, 보안 작업은 정의상 그 5 % 안에 들어갑니다. 보안 리뷰가 주요 업무라면, Opus 4.8 답변에 대해 Fable 5 요금을 지불하게 됩니다. 중간 단계를 건너뛰고 바로 Opus 4.8을 사용하세요. 트래픽이 전환을 일으키는지 확인하려면 응답에 포함된 model 필드를 확인하면 됩니다(전환은 기본적으로 무음).

지연에 민감한 반복 작업도 Opus에 남아 있습니다. Fast Mode가 Opus에만 존재하기 때문입니다. Claude Code에서 긴밀한 편집‑테스트 루프를 돌릴 때는 Fast Mode가 활성화된 Opus 4.8이 표준 속도 Fable 5보다 여전히 빠르게 느껴집니다. 일상적인 Opus 작업에 대한 자세한 내용은 **[Opus 4.8 in Practice: A Real Coding Session]**을 참고하세요.

마지막으로, 프롬프트가 짧고 작업이 일상적이라면, 스프레드시트 스위트에서 Fable 5가 25 ~ 30 % 빠른 결과를 보였다고 해서 전환할 필요는 없습니다. 쉬운 작업에서 속도는 병목이 아니기 때문입니다.

결론

두 배 가격은 현실이며, 티어 차이도 존재합니다. 제가 두 모델을 사용해 본 뒤 만든 규칙은 다음

0 조회
Back to Blog

관련 글

더 보기 »