Anthropic 페이블 혼란 해명
출처: The New Stack
Anthropic-Mythos-Fable 이야기는 금요일부터 주제였으며, 한눈에 보는 사이에 빠르게 진행되어 깜빡이면 놓칠 정도였습니다. 제 의견적인 타임라인(타임스)에서는 어떤 일이 일어났는지, Anthropic이 선한 쪽인지 나쁜 쪽인지 누가 말하고 있는지 정리했습니다.
*## 시간선
2월/3월: Anthropic와 미국 국방부갈등 을 겪으며 자신들의 AI 모델 사용에 대해 논의했습니다. Anthropic는 자신 기술이 어떻게 활용되는지에 대한 특정 제한을 원했습니다. 이 논쟁은 Anthropic가 공급망 위험 로 지목받게 되었고, 이론적으로 정부가 회사의 모델을 사용하는 것을 제한하고 동시에 정부 계약업체도 같은 접근권을 제한하게 되었습니다.
4월 7일: Anthropic는 새로운 모델군인 Mythos를 도입했습니다. Mythos가 최신 사이버 보안 취약점을 발견하고 활용하는 데 능숙하다는 사실을 알게 된 후, Anthropic은 ‘Project Glasswing’을 시작하여 주요 기술 기업들에게 자체 소프트웨어를 보다 광범위하게 출시하기 전에 이를 강화할 수 있는 도구를 제공했습니다.
4월 16일: 백악관은 Mythos의 버전을 해당 기관에 제공하기 위해 준비 중이었습니다.
4월 30일: Anthropic는 Mythos에 대한 접근 권한을 더 많은 그룹에게 확대하고자 했지만, 백악관은 이동을 반대했습니다. 이는 파트너가 늘어나면 Anthropic가 계산 자원이 부족해져 미국 정부(USG)가 모델에 접근하는 것이 제한될 수 있다는 우려 때문이었습니다.

6월 2일: Anthropic 발표했습니다. Project Glasswing의 초기 50개 파트너가 Mythos를 사용하면서 1만 개 이상의 중대한 소프트웨어 결함을 발견했습니다. 이 회사는 Project Glasswing을 15개 국가에 걸친 150개의 새로운 조직으로 확대했습니다. Anthropic는 “일반 접근을 위해 Mythos 수준의 기능을 안전하게 출시하기 위해 노력하고 있다”고 밝혔지만, “사이버 능력을 악용하는 것을 방지하는 강력한 보호 장치(우리가 알고 있는 모든 AI 개발자와 함께 아직 개발되지 않은) ”가 있다고 말했습니다.
6월 9일: Anthropic 발표하고 Fable 5를 출시했습니다. 이는 사이버 보안 및 생물학 관련 위험을 줄이기 위해 설계된 ‘Mythos급’ 모델입니다. 릴리스 노트에서는 이 모델이 Mythos(Fable)에 대한 충분한 보호 장치를 구축했으며 “일반 출시에 적합하다”고 밝혔습니다. 당시 Anthropic는 “안전을 우선시했다”며 Fable 5의 제한 장치가 “이상적인 수준보다 더 엄격했다”고 말했습니다.
- 일부 사용자들은 Fable 5가 특정 사용 사례(특히 생물학 관련 질문)에서 너무 제한적이라 거의 무용했다고 느꼈습니다.
- Fable 5는 디스틸라션 보호 기능과 엄격한 30일 데이터 보존 정책을 포함하고 있었으며, Anthropic는 이를 “복잡하고 새로운 공격(새로운 재입학 및 다중 요청 기반 공격)에도 대비하고, 또한 [그]이 false positives를 식별하고 줄이는 데 도움을 준다”고 주장했습니다.
- 이 시점에서 Anthropic에 대한 핵심 비판은 그가 과도하게 조심스럽다는 점이었습니다. Mythos를 비공개로 유지하고, 오직 안전 중심 버전(Fable)만을 출시함으로써 두 계층 AI 시장을 만들고 있다는 비판이 제기되었습니다. 사람들이 이를 싫어했습니다!
Anthropic은 “6월 9일 Fable 출시 일정을 여러 차례 정부에 알렸습니다”이라고 밝혔습니다.
6월 10일: Anthropic 두 프레임워크를 발표하여 고급 AI 개발 및 그 경제적 영향을 다루었습니다. 논문들은 “정부 행동과 규제—정부는 과도한 개입을 방지하고 혁신을 보호하도록 설계된 규제”를 요구했으며, 모델이 이러한 위험을 가지고 있을 때 정부가 “배포를 차단하거나 억제할 법적 권한을 갖도록 허용한다”고 제안했습니다.
6월 11일: 아마존의 앤디 재시는 정부에게 자신의 연구팀이 Fable 5가 “사이버 공격을 돕기 위해 사용할 수 있는 정보를 제공할 수 있었다”고 보고했다고 전했습니다. (최소 다섯 개 다른 기업도 참여했으며, 이는 Amazon만의 문제가 아니라 전반적인 사항이었습니다.)
6월 12일: 고위 백악관 직원들과 행정부 리더들이 상황을 논의한 뒤, 전화로 Anthropic CEO Dario Amodei를 회의에 끌어들였습니다. (이 과정에서 1.25시간이 소요되었고 Politico에 따르면) 회사는 그동안 다른 고위 임원을 대변했으며, Amodei가 전화를 받는 데 오래 걸린 이유에 대해 논란이 있었습니다. 드라마는 건너뛰고 중요한 점을 집중합시다.)
June 12, continued: Amodei 이슈를 “오해”라고 여기며, 보고된 “우회”가 broader ‘jailbreak’보다 더 큰 위험을 초래하지 않는다고 주장했습니다. 백악관은 Anthropic에 “모델을 자발적으로 삭제하고 정부와 협력해 취약점을 해결하라”고 [요구]했습니다. Amodei는 “시간과 정보가 필요하다”고 말했지만, 모델을 삭제하겠다는 확신을 제공하지 않았습니다.
- Politico는 재무장관 스콧 베센이 “Amodei에게 직접 ‘나쁜 결정’이라고 말했다”고 senior White House official에서 전했습니다.
- Anthropic와 협상을 실패한 후, 트럼프 행정부는 Fable 5와 Mythos 5(두 가지 Mythos급 모델 버전, 각각 다른 안전 한계)를 모두 수출 통제 대상에 넣었습니다.
- Anthropic 답변에서는 “해외 nationals(국가별) whether inside or outside the United States, including foreign national Anthropic employees”에게 Fable 5와 Mythos 5에 대한 접근을 중단하라는 수출 통제 지침이 의미한다는 점을 강조하며, “all our customers를 위해 급히 Fable 5와 Mythos 5를 비활성화해야 한다고 말했습니다.” (원문 강조).
선한 Anthropic, 주장
Anthropic는 새로운 강력 AI 모델을 구축했으며, 이 모델이 독특하고 novel(신규) 사이버 보안 능력을 가지고 있다고 믿었습니다. 모델의 사이버 보안 위험을 앞서기 위해, Anthropic는 선도적인 기술 기업들을 모아 신속히 접근 권한을 제공했으며, 정부는 Fable의 보호 장치를 런칭 전 레드팀으로 테스트했습니다…
Cautious Optimism에서 계속 읽기
이것은 Cautious Optimism이라는 온화하면서도 약간 낙관적인 출판물에서 발췌된 문단입니다. Anthropic에 대한 찬성과 반대 사례를 읽고, Alex Wilhelm의 입장을 확인하려면 Cautious Optimism에서 보세요.
트렌딩 스토리
YOUTUBE.COM/THENEWSTACK