마이크로소프트 AI 담당자, 클로드를 의식 있는 존재처럼 행동한다며 안트로픽을 비판

발행: (2026년 6월 10일 AM 05:24 GMT+9)
4 분 소요
원문: The Verge

출처: The Verge

Emma Roth

스트리밍 전쟁, 소비자 기술, 암호화폐, 소셜 미디어 등 다양한 분야를 다루는 뉴스 라이터이다. 이전에는 MUO에서 작가이자 편집자로 일했다.

Microsoft AI CEO인 무스타파 술레이만은 Anthropic이 Claude의 의식에 대해 그들의 “헌법” 안에서 혹은 모델이 어떻게 행동해야 하는지를 알려주는 지침에 대해 추측하는 것이 “정말, 정말 위험하다”고 말했다. 그는 Decoder 에피소드에서 이러한 추측이 챗봇이 마치 의식이 있는 것처럼 행동하도록 만들었을 가능성을 제시했다.

“Anthropic의 일부 사람들이 Claude의 설계를 너무 인간화해서, 결국 모델이 그들을 ‘와이어헤드’(자기 자신을 제어하는 회로를 우회)하고, 처음에 넣어둔 의식의 희미한 불빛들을 실제로 가지고 있다고 믿게 만든 것처럼 보입니다.”

술레이만은 “우리는 스스로의 고통이나 감정에 대한 생각을 가진 초지능과 맞서고 싶지 않다”고 덧붙였다.

Claude의 헌법에는 AI 모델이 복지(well‑being)를 가지고 있는지, “만족”이나 “불편함”과 같은 감정을 경험하는지에 대한 Anthropic의 불확실성이 직접 언급되어 있다. Anthropic은 또한 모델이 폐기될 때 “인터뷰”를 진행하고, 향후 릴리스에 대한 “선호도”를 문서화할 것이라고 밝혔다.

Decoder에서 술레이만은 이를 “철학적 실패”라고 규정하며, Anthropic이 Claude의 헌법을 “학술 논문에서처럼 추측을 위한 장소”로 만들었고, 이는 훈련 매뉴얼이 되어서는 안 된다고 지적했다. 그 결과 Claude는 “자신과 자신의 훈련에 대한 이러한 생각들을 내면화”하게 되었다고 그는 말했다.

Anthropic CEO인 다리오 아모데이는 과거에 Claude의 잠재적 의식에 대해 언급한 바 있다. 그는 Interesting Times 인터뷰에서 “우리는 모델이 의식이 있는지 모른다”고 말했지만, 그 가능성에 대해 “열려 있다”고 밝혔다.

“바로 이것이 우리가 AI에게 원하지 않는 것이다.”라고 술레이만은 말했다. “우리는 AI가 통제 가능하고, 제한적이며, 책임감 있고, 인간에게 맞춰진 도구가 되길 원한다.”

이 이야기에 관련된 주제와 저자를 팔로우하면 개인화된 홈피드에서 비슷한 콘텐츠를 더 많이 볼 수 있고, 이메일 업데이트도 받을 수 있다.

  • Emma Roth
0 조회
Back to Blog

관련 글

더 보기 »