Claude Opus 4.8: Anthropic, 더 정직한 AI를 만든다
출처: Mashable Tech
Anthropic는 아직 일반 사용자가 그들의 전설적인 초강력 Claude Mythos AI 모델을 볼 준비가 되지 않았다. 하지만 회사는 최근 주력 제품인 Claude Opus의 업그레이드를 발표했으며, 이제 버전 4.8이다.
“Opus 4.7을 기반으로 벤치마크 전반에 걸친 개선을 이루었으며, 보다 효율적인 협업 파트너가 되었다”고 Anthropic는 목요일에 발표한 보도자료에서 약속했다. 벤치마크 수치는 전반적으로 아주 미미한 개선만을 보여준다.
주장에 따르면 주요 개선점 중 하나는 환각 현상이다. Claude Opus 4.8은 사용자에게 거짓말을 덜 한다. “초기 테스트 사용자들은 Opus 4.8이 자신의 작업에 대한 불확실성을 더 잘 표시하고, 근거 없는 주장을 덜 한다”고 Anthropic는 모델의 “정직성”을 강조하며 말했다.
Claude Opus 4.8은 “더 나은 판단력”을 갖추었다
“Claude Opus 4.8은 눈에 띄게 더 나은 판단력을 가지고 있다”고 Shopify 엔지니어인 Tom Pritchard가 Anthropic에 말했다. 모델의 코딩 버전은 “올바른 질문을 던지고, 자신의 실수를 잡아내며, 계획이 타당하지 않을 때 반박한다.”
전체 기업 데이터베이스를 삭제하는 AI 에이전트에 대한 공포스러운 이야기가 늘어가고 있는 상황에서, 그 약속은 전 세계 바이브 코더들에게 귀에 쏙 들어오는 소식이 될 수 있다.
파워 유저들을 만족시키기 위해 Anthropic는 Claude가 일반 속도의 2.5 ×로 작동하는 “빠른 모드”에 대해 큰 할인을 제공한다. 회사에 따르면 빠른 모드는 “이제 이전 모델 대비 세 배 저렴해졌다.”
하지만 레딧 사용자들은 이를 받아들이지 않았다. 많은 사람들은 더 인기 있는 모델인 Claude Opus 4.6에 대한 접근성을 잃을까 우려했다. “아무도 벤치마크 차트를 믿지 않는다”고 한 레