chain-of-thought 모니터링 가능성 평가
발행: (2025년 12월 18일 오후 09:00 GMT+9)
1 min read
원문: OpenAI Blog
Source: OpenAI Blog
Overview
OpenAI는 체인‑오브‑쓰레드 모니터링 가능성을 위한 새로운 프레임워크와 평가 스위트를 소개합니다. 이 스위트는 24개의 환경에서 13개의 평가를 포괄합니다. 우리의 연구 결과는 모델의 내부 추론을 모니터링하는 것이 단순히 출력만 모니터링하는 것보다 훨씬 효과적이며, 확장 가능한 co…