Google의 'internal RL'이 장기적 AI 에이전트를 열 수 있는 방법
발행: (2026년 1월 17일 오전 07:41 GMT+9)
1 min read
원문: VentureBeat
Source: VentureBeat
Overview
Google의 연구원들은 일반적으로 대형 언어 모델(LLM)이 환각을 일으키거나 제대로 작동하지 못하게 하는 복잡한 추론 작업을 학습하기 쉽게 만드는 기술을 개발했습니다. 다음 토큰 예측을 통해 LLM을 훈련시키는 대신, 이들이 제안한 내부 강화 학습(internal reinforcement learning, internal RL) 이라는 기술은…