이상한 일반화를 통한 LLM 손상

발행: (2026년 1월 12일 오후 09:02 GMT+9)
1 min read

Source: Schneier on Security

매혹적인 연구

이상한 일반화와 귀납적 백도어: LLM을 손상시키는 새로운 방법

초록
LLM은 일반화가 뛰어나서 유용합니다. 하지만 좋은 것이 너무 많을 수 있을까요? 우리는 좁은 맥락에서 소량의 파인튜닝이 그 밖의 행동을 크게 바꿀 수 있음을 보여줍니다…

Back to Blog

관련 글

더 보기 »