이상한 일반화를 통한 LLM 손상
발행: (2026년 1월 12일 오후 09:02 GMT+9)
1 min read
Source: Schneier on Security
매혹적인 연구
이상한 일반화와 귀납적 백도어: LLM을 손상시키는 새로운 방법
초록
LLM은 일반화가 뛰어나서 유용합니다. 하지만 좋은 것이 너무 많을 수 있을까요? 우리는 좁은 맥락에서 소량의 파인튜닝이 그 밖의 행동을 크게 바꿀 수 있음을 보여줍니다…