· ai
AI를 위한 ‘truth serum’: OpenAI의 모델이 실수를 고백하도록 훈련하는 새로운 방법
OpenAI 연구원들은 대형 언어 모델(LLMs)을 위한 'truth serum' 역할을 하는 새로운 방법을 도입하여, 모델이 스스로 자신의 오작동을 보고하도록 강제합니다.
OpenAI 연구원들은 대형 언어 모델(LLMs)을 위한 'truth serum' 역할을 하는 새로운 방법을 도입하여, 모델이 스스로 자신의 오작동을 보고하도록 강제합니다.
2020년 5월 어느 밤, 봉쇄가 절정에 이르던 시기에 Deep Ganguli는 걱정하고 있었습니다. 당시 Stanford Institute for Human-Centered AI의 연구 이사였던 Ganguli는…
평가하지 않으면 정렬할 수 없습니다. “Why AI Alignment Starts With Better Evaluation”라는 게시물이 처음으로 Towards Data Science에 게재되었습니다....