Anthropic, Claude Mythos/Fable 5 출시… 빨리 써보세요.
출처: The New Stack
화요일에 Anthropic은 Fable 5를 출시했습니다. 이는 일반 사용자에게 처음으로 제공되는 Mythos‑class 모델입니다.
Fable 5는 기본적으로 지난 몇 주 동안 회사가 소개해 온 고성능 Mythos 모델과 동일하지만, 악성코드나 생물학 무기와 같은 악용을 방지하기 위한 가드레일이 적용되었습니다.
복잡성을 더하자면, Anthropic은 Mythos 5도 동시에 출시했는데, 이는 일부 가드레일이 제거된 최신 버전이며 초기에는 Project Glasswing 회원에게만 제공됩니다.
Fable 5 사용 가능 여부: 첫 번째는 언제나 무료
Mythos와 달리, 오늘 바로 Fable 5를 사용할 수 있습니다. Anthropic에 따르면 현재 API(및 Microsoft Foundry, Amazon Bedrock, AWS의 Claude Platform)에서 입력 토큰 백만 개당 $10, 출력 토큰 백만 개당 $50에 제공됩니다. 이는 Anthropic의 기존 Opus 모델 가격의 두 배에 해당합니다.
Anthropic은 Fable 5가 개념적 추론, 문서 작업, 차트와 표 해석에 있어 더 뛰어나다고 주장합니다.
현재 Fable 5는 Claude Pro, Max, Team, 그리고 좌석 기반 엔터프라이즈 구독자에게도 제공되고 있지만, 한 가지 조건이 있습니다. 6월 22일 이후에는 이용이 종료됩니다. 6월 23일부터는 Fable 5 사용에 크레딧이 필요합니다.
그 이유는 Anthropic이 현재 겪고 있는 용량 문제 때문입니다. “충분한 용량이 확보되는 시점에—가능해지는 대로—Fable 5를 구독 플랜의 표준 옵션으로 복구할 계획이며, 가능한 한 빠르게 진행하겠습니다.”라고 Anthropic은 설명합니다.
벤치마크
실제로 여러분이 얻게 되는 모델은 거의 모든 벤치마크에서 뛰어난 성능을 보이며, 그 차이도 상당히 큽니다.
코드 저장소를 선별해 문제를 해결하도록 만든 SWE‑Bench Pro 테스트에서 Fable 5는 80% 점수를 기록했으며, 가드레일이 없는 Mythos 5는 80.4%를 기록했습니다. 이는 Anthropic 자체 Opus 4.8(69.2%)은 물론, OpenAI GPT 5.5(58.6%)와 Google Gemini 3.1 Pro(54.2%)보다 훨씬 앞선 결과입니다.

코딩, 도구 사용, 컴퓨터 활용, 지식 작업 등 어떤 분야의 벤치마크든 거의 동일한 우위를 보입니다.
하지만 벤치마크는 전체 이야기를 다 보여주지는 않으며, 실제 현장에서 모델이 얼마나 잘 작동하는지는 별개입니다. Anthropic은 Fable 5와 Mythos 5가 다른 모델보다 더 오래 자율적으로 작업할 수 있고, 복잡한 과제를 처리할 수 있다고 주장합니다. 예를 들어 Stripe는 Fable 5를 이용해 5천만 라인 규모의 Ruby 코드베이스를 하루 만에 현대화했는데, 이는 기존에 개발자 팀이 두 달 걸렸을 작업이라고 합니다.
Anthropic이 언급한 바와 같이, 새로운 모델은 “수백만 토큰에 걸친 장기 작업에서도 집중을 유지하고, 자체 메모를 활용해 출력을 개선”할 수 있기 때문입니다.

GitHub 최고 제품 책임자인 Mario Rodriguez도 이 “오래 집중할 수 있는 능력”이 Fable 5가 더 복잡한 프로그래밍 작업을 수행하게 만든다고 강조했습니다.
“Fable 5는 GitHub이 지원하는 개발자들에게 실질적인 도약을 제공합니다.”라고 Anthropic 발표 블로그에 인용된 그의 말이 있습니다. “초기 테스트에서 우리는 복잡하고 장기적인 코딩 과제를 이전 벤치마크를 뛰어넘는 자율성과 신뢰성으로 수행했습니다. 가장 흥미로운 점은 향후 개발자들이 점점 더 야심찬 작업을 에이전트에게 맡기고, 소프트웨어 라이프사이클 전반에 걸쳐 결과를 신뢰할 수 있는 미래가 열릴 것이라는 방향성입니다.”
지식 작업에서도 향상된 메모리 기능이 적용돼, Anthropic은 Fable 5가 개념적 추론, 문서 작업, 차트·표 해석에 더 뛰어나다고 말합니다.
안전장치와 거부 응답
안전장치는 Fable 5의 핵심 기능입니다. 여기서 위험 요소는 모델이 과도하게 보수적으로 튜닝될 경우 정답을 지나치게 많이 거부할 수 있다는 점입니다. Anthropic에 따르면, 최초 Mythos 모델은 “너무 위험해 출시할 수 없었다”고 합니다. 회사는 모든 Mythos‑class 모델이 “남용을 방지하기 위해 강력한 안전장치를 필요로 하며, 그 적용 범위가 넓어야 한다. 안전장치는 지속적이고 정교한 회피 시도에도 견뎌야 한다”고 주장합니다.
모델이 잠재적 남용을 감지하면 해당 질문에 직접 답하지 않고, “사이버 보안, 생물·화학, 증류”와 관련된 요청이 감지되면 Opus 4.8에게 작업을 넘깁니다.
제가 직접 테스트한 결과, Fable 5는 자체 모델 카드에 대한 추론을 거부했는데, 이는 모델이 피해야 할 주제가 모델 카드에 다수 포함돼 있기 때문으로 보입니다.
Anthropic에 따르면 현재까지 Fable 5 세션 중 5% 미만에서만 이러한 거부가 발생했지만, 초기 접근 권한을 가진 사용자들이 전체 Claude 사용자군을 대표한다고 보긴 어렵습니다.
30일 데이터 보존
Mythos‑class 모델을 사용하려는 경우, 데이터 보존을 선택 해제할 수 없습니다. 앞으로는 해당 모델을 사용할 때 30일 데이터 보존에 동의해야 하며, 동의하지 않으면 모델을 사용할 수 없습니다.
Anthropic은 이 데이터를 새 모델 학습에 사용하지 않으며, 모든 인간 접근을 로그로 기록한다고 밝힙니다. 그러나 회사는 “복잡하고 새로운 공격(새로운 탈옥 시도 및 다중 요청에 걸친 공격 포함)에 대비하고, 오탐을 식별·감소시키는 데 이 데이터가 필요하다”고 주장합니다.
그럼에도 불구하고 일부 기업은 Anthropic이 데이터를 보관하는 것 자체에 동의하고 싶어하지 않을 것입니다.
앞으로의 계획
Fable 5는 현재 시장에서 가장 강력한 모델임이 분명합니다. 이는 대부분이 기대했던 바이며, 기대에 못 미친다면 큰 실망이었을 것입니다.
따라서 출시 초기 반응은 모델의 성능보다는 구독자에게 제공되는 짧은 사용 기간과 데이터 보존 정책에 더 초점을 맞추었습니다.
이제 실제 현장에서 모델이 기대에 부응할 수 있을지가 남아 있습니다. 그 검증은 보통 며칠 정도 걸립니다.
TRENDING STORIES
YOUTUBE.COM/THENEWSTACK
Tech moves fast, don’t miss an episode. Subscribe to our YouTube channel to stream all our