Anthropic, 연구자 작업을 ‘방해’한 정책을 철회.
출처: Engadget
학계와 긴밀히 협력한다는 자부심을 가진 기업에게는 좋은 이미지가 아니었다.
Primakov/Shutterstock
Anthropic은 새로운 Claude Fable 5 LLM을 사용해 경쟁 AI 모델을 만들려는 연구자들을 은밀히 방해한 정책을 철회하고 있다고 *Wired*에 전했다. “우리는 최첨단 LLM 개발을 위한 Fable 5의 안전장치를 가시적으로 바꾸고 있습니다,” 라고 회사는 성명에서 밝혔다. “우리는 잘못된 균형을 잡았고, 그 점에 대해 사과합니다.”
Anthropic이 강력한 Mythos 시스템을 기반으로 한 새로운 모델 Claude Fable 5를 공개했을 때, 연구자들은 이상한 점을 발견했다. 특정 작업을 요청하면 Fable 5가 조용히 더 낮은 성능의 모델로 요청을 전환한다는 것이었다. 게다가 이 제한 사항은 모델 문서에 전혀 언급되지 않았다.
새 모델은 경쟁 LLM을 학습시키거나, AI 코드를 디버깅하거나, 신경망 구조를 최적화하는 등과 같은 작업에 대해 응답을 거부하거나 성능을 저하시키고 있었다. 연구자들은 단순히 성능 저하 자체보다도 Anthropic이 이를 투명하게 밝히지 않은 점에 불만을 가졌다. 또한 기대한 대로 동작하지 않는 모델에 토큰과 비용을 소모했다는 점도 우려했다.
Anthropic은 스스로를 OpenAI보다 더 윤리적이고 연구자 친화적인 대안으로 포장해 왔기 때문에, Fable 5와 관련된 이번 사태는 빠른 반발을 일으켰다. “연구자에게 알리지 않고 머신러닝 연구 성능을 저하시키는 것은 충격적으로 적대적이며 형편없는 모습이다,” 라고 연구원 겸 Substack 작가 Dean W. Ball이 X에서 말했다.
Anthropic은 Fable 5에 대한 안전장치 정책을 완전히 뒤집는 것이 아니라, 제한 사항을 사용자에게 명확히 보여주는 방향으로 바꾸고 있다. “만약 사용자가 Claude를 이용해 고성능 AI를 만들려는 시도를 한다고 판단되면, 시스템은 요청을 거부하거나 더 낮은 성능의 모델로 전환한다는 알림을 표시할 것”이라고 Wired는 전했다.