클로드 새 모델, 실수할 때 더 ‘솔직’
출처: The Verge
Claude Opus 4.8
Anthropic은 목요일에 Claude Opus 4.8을 출시하면서 모델의 **“정직성”**을 강조하고 있습니다. Anthropic에 따르면, “모든 모델을 정직하도록 훈련한다 – 예를 들어, 근거가 없는 주장을 하지 않도록 한다”고 합니다. 회사는 “AI 모델의 일반적인 문제는 가끔 결론을 서두르게 되고, 얇은 증거에도 불구하고 자신들의 작업이 진전을 이루었다고 자신 있게 제시한다”는 점을 지적했습니다.
초기 테스트 참가자들은 Opus 4.8이 “작업에 대한 불확실성을 표시할 가능성이 더 높고, 근거 없는 주장을 할 가능성은 낮다”는 것을 발견했습니다. 회사 평가에 따르면 Opus 4.8은 “전 버전보다 약 4배 정도 덜 그럴 가능성이 있다 …”고 합니다.