Anthropics Claude Mythos 및 유사 모델, 공개 예정

발행: (2026년 5월 27일 AM 01:42 GMT+9)
5 분 소요

출처: Mashable Tech

발표

Anthropic은 고급 사이버 보안 기능을 갖춘 AI 모델 Mythos의 공개 버전을 궁극적으로 출시할 계획을 발표했습니다. 이 회사는 4월에 Mythos를 처음 공개하면서 테스트 중에 작동하는 익스플로잇을 **72.4 %**의 비율로 생성했으며, Claude Opus 4.6은 거의 0 %에 불과했다고 밝혔습니다.

Project Glasswing이라는 제한된 접근 보안 프로그램에 대한 업데이트에서 Anthropic은 “Mythos‑class 모델”을 “가까운 미래”에 보다 넓은 공개를 시도하기 전에 미국 및 동맹 정부에 대한 접근을 확대할 의향이 있다고 밝혔습니다. [Glasswing 업데이트]

The Register가 보도한 바에 따르면, Anthropic은 일정의 불확실성에 대해 솔직히 말하면서, “모델이 악용되는 것을 방지할 충분한 방어 장치를 아직 구축한 기업은 없으며, 우리 자신도 포함한다”고 했습니다. 그럼에도 관련 블로그 포스트에서는 “Mythos 수준의 모델이 향후 6‑12 개월 내에 널리 제공될 것”이라고 자신감을 표명했습니다. [The Register] [Anthropic 블로그]

모델 능력

  • 내부 테스트에서 Mythos는 시도 중 **72.4 %**에서 작동하는 익스플로잇을 생성했으며, Claude Opus 4.6은 **0 %**에 약간 못 미치는 수준이었습니다.
  • 모델은 천 개가 넘는 오픈소스 프로젝트를 스캔하여 23,000개 이상의 결함을 찾아냈으며, 그 중 6,000개 이상이 고위험 또는 치명적인 심각도로 평가되었습니다.
  • 눈에 띄는 발견 중 하나는 wolfSSL 암호화 라이브러리(수십억 대의 장치에서 사용)에서의 취약점으로, 공격자가 인증서를 위조하고 합법적인 웹사이트로 가장할 수 있었던 점입니다. 이 문제는 이미 패치되었습니다.

사이버 보안에 미치는 영향

AI 도구가 익스플로잇을 찾는 능력이 향상되면서 제로데이 버그 발견 위기가 촉발되었습니다. 일부 버그 바운티 프로그램은 완전히 종료되었고, 오픈소스 유지보수자들은 버그 보고서의 홍수 때문에 Anthropic에 공개 속도를 늦춰 달라고 요청했습니다.

Anthropic이 제시한 해결책은 더 많은 AI를 투입하는 것입니다. Claude Mythos 시스템 카드는 AI 도구가 궁극적으로 사이버 보안 방어자에게 이득이 될 것으로 예측하지만, 현재는 해커가 일시적인 우위를 가질 수 있다고도 언급합니다. [시스템 카드 (PDF)] [관련 Mashable 기사]

향후 출시 계획

Anthropic은 아직 충분한 방어 장치가 마련되지 않았음을 인정합니다. 회사는 다음과 같이 진행할 계획입니다:

  1. Mythos‑class 모델의 악용을 방지하기 위한 강력한 안전 메커니즘을 개발한다.
  2. 미국 및 동맹 정부에 대한 제한적 접근을 중간 단계로 확대한다.
  3. 안전 장치가 충분하다고 판단될 경우 보다 넓은 공개를 추진하며, 널리 이용 가능해지는 시점은 6–12 개월 정도로 예비적으로 잡고 있다.

일정은 여전히 불확실하며, Anthropic은 현재 단계에서 기존 방어 장치가 완전한 안전 배포를 보장할 수 없다고 강조합니다.

0 조회
Back to Blog

관련 글

더 보기 »