Anthropic의 새 Claude Fable 5, Mythos와 동일한 기본 모델에 가드레일을 추가.
출처: ZDNet
Elyse Betters Picaro / ZDNET*ZDNET 팔로우: 우리를 선호 소스로 추가하기 (Google).
ZDNET의 주요 요점
- Anthropic이 일반 사용자에게 Claude Fable 5를 출시합니다.
- Fable 5는 Mythos 등급의 성능에 안전 제어 장치를 추가했습니다.
- 가격은 Claude Opus 4.8의 약 두 배 수준입니다.
Anthropic은 기존에 극히 제한된 Mythos 대형 언어 모델의 ‘독을 뺀’ 버전을 발표했습니다. Claude Fable 5라는 이름으로, 회사는 새로운 AI를 “일반 사용에 안전하도록 만든 Mythos‑클래스 모델”이라고 설명합니다.
Mythos는 4월에 대대적인 홍보와 함께 공개됐으며, 경험이 풍부한 개발자나 다른 AI조차 찾지 못하는 코드 취약점을 찾아낼 수 있는 모델로 소개되었습니다.
또한: 미국 노동자들이 세계에서 가장 큰 AI 회의론자이며, 이는 일자리 상실 때문만은 아니다
Mythos는 Project Glasswing이라는 맨해튼 프로젝트식 팀 노력의 핵심 구성 요소로 제공됐으며, 잘못된 손에 들어가면 너무 위험하다고 판단돼 Glasswing 파트너에게만 제한적으로 제공되었습니다. 파트너에는 Amazon Web Services, Anthropic, Apple, Broadcom, Cisco, CrowdStrike, Google, JPMorgan Chase, Linux Foundation, Microsoft, Nvidia, Palo Alto Networks 등이 포함됩니다.
지금까지 Mythos는 프리뷰 제품으로만 간주되었습니다. 이제 Anthropic은 Mythos 프리뷰에 접근할 수 있는 모든 사용자에게 Claude Mythos 5를 출시합니다. 회사는 “점진적인 신뢰 접근 프로그램을 통해 접근성을 차차 확대할 계획”이라고 밝혔습니다.
Mythos 프리뷰와 Mythos 5 사이의 구체적인 차이에 대한 상세 정보는 제공되지 않았으며, 후자는 베타 버전 이후의 최종 형태로 보입니다.
또한: Apple의 새로운 Siri AI, 파워 유저가 알아야 할 숨은 비용
Anthropic은 또한 Fable 5를 공개했습니다. 이 기술은 Mythos와 동일한 기본 모델을 사용하지만, 보안 및 생물학 분야의 고위험 영역에 대한 응답을 차단하는 안전 장치를 포함하고 있습니다.
‘생물학’이라는 언급이 눈에 띕니다. 로그에 생물학 무기 프롬프트나 응답이 있었던 걸까요? Anthropic에 물어봤지만, 답을 받을 가능성은 낮아 보입니다.
흥미롭게도, Fable 5 프롬프트가 고위험 영역에 들어가면 모델은 Opus 4.8으로 전환되며, 이 역시 자체 제한을 가지고 있습니다. Opus 4.7 이후부터 Anthropic은 “대량 데이터 탈취나 랜섬웨어 코드 개발처럼 거의 항상 악의적으로 사용되고 정당한 방어적 용도가 거의 없는 활동”을 차단합니다.
보안 클리어런스를 보유한 Anthropic 직원은 Opus 4.7·4.8을 사용해 업무 수행 중 차단된 보안 활동을 수행할 수 있습니다. 고지: 저는 Anthropic 사이버 검증 프로그램(Cyber Verification Program)의 인증 회원으로, 사이버 전쟁·방어·대테러 작업에 필요한 기능에 접근할 수 있습니다. 사이버 검증 프로그램을 통해 인증받은 사용자가 Fable 5로 차단된 쿼리를 실행할 수 있는지는 아직 명확하지 않습니다.
또한: ChatGPT로 무료 PDF 편집기를 만들었는데, 파일을 바꾸는 걸 믿지 못해 직접 만들었다 – 정말 멋졌다
Anthropic은 Fable이 악의적인 목적에 사용될 위험이 거의 없다고 자신합니다. “초기 데이터에 따르면 Fable 세션의 95% 이상이 전적으로 Fable 자체 응답만으로 진행되었으며, 백업 모델로 전환되지 않았습니다. 우리는 분류기의 강인성을 검증하기 위해 레드팀 테스트를 광범위하게 수행했으며, 1,000시간 이상의 외부 버그 바운티 테스트에서도 보편적인 탈옥(jailbreak) 사례를 찾지 못했습니다. 이후 외부 레드팀 조직과 협업했지만 역시 보편적인 탈옥을 발견하지 못했습니다.”라고 전했습니다.
발표 자료만으로는 Fable 5에 대해 공유할 정보가 많지 않지만, Anthropic은 몇몇 고객 의견을 공개했습니다.
코드·디자인 플랫폼 Base44(비공개 기업)의 담당자는 “Fable은 한 번에 전체 앱을 생성하는 능력이 훨씬 깊고 뛰어나며, 툴 호출 기능도 탁월합니다.”라고 말했습니다.
또한: AI가 친밀 파트너 폭력을 사람들의 고백보다 먼저 식별할 수 있다면, 과연 안전한가?
AI 워크스페이스 Genspark의 담당자는 “Fable은 우리 평가에서 1위를 차지했으며, 테스트한 모든 모델을 상대로 일대일 대결에서 승리했습니다. UI 디자인과 게임 코딩 같은 가장 어려운 과제에서도 현저히 강력했습니다.”라고 전했습니다.
전자상거래 마켓플레이스 Rakuten의 담당자는 “가장 높은 수준의 작업에서도 Fable은 스스로의 결과를 검토하고 검증합니다. 이는 우리에게 높은 자율성을 가능하게 하는 핵심 요소이며, 추가적인 사고가 스스로 비용을 상쇄합니다.”라고 밝혔습니다.
가격 측면에서 Fable 5와 새로운 Mythos 5는 입력 토큰 100만 개당 $10, 출력 토큰 100만 개당 $50을 청구합니다. 이는 Claude Opus 4.8의 약 두 배 수준입니다.
Anthropic은 높은 수요를 예상해 Fable 5에 대해 독특한 출시 계획을 제시했습니다:
- 오늘부터 6월 22일까지, Fable 5는 Pro, Max, Team, Enterprise(좌석 기반) 플랜에 추가 비용 없이 포함됩니다.
- 6월 23일부터는 해당 플랜에서 Fable 5가 제외되며, 사용하려면 사용 크레딧이 필요합니다.
- 이후에는 가능한 한 빨리 Fable 5를 구독 플랜의 표준 구성 요소로 복구할 예정입니다.
Mythos와 Fable이라는 이름 선택에 대한 깊은 설명은 없었습니다. 브리태니커에 따르면, mythos는 “세계의 기원과 문화적 가치를 설명하는 복합적인 신성한 서사·전통 이야기·신념 체계”이며, fable은 “특정 도덕 교훈을 가르치기 위한 짧은 허구 이야기”라고 정의됩니다. 이 차이를 어떻게 해석하든 자유롭게 생각해 보세요.
앞으로 두 제품에 대해 더 많은 정보를 얻을 수 있을 겁니다. 제 Max 플랜에서 Fable 5를 사용할 수 있게 된다면, 코딩 챌린지로 직접 테스트해볼 예정이니 기대해 주세요.
Opus보다 두 배 비싸더라도, 내장된 안전 장치가 있는 Mythos 수준의 파워를 제공한다면 Claude Fable