[논문] LLM 컨디셔닝의 효율성‑유창성 트레이드오프: 체계적 연구
개요
대형 언어 모델(LLM)의 출력을 제어하는 것은 신뢰할 수 있는 배포를 위한 핵심 과제이지만, 관련된 트레이드오프에 대한 명확한 이해는 아직 부족합니다. 현재의 컨디셔닝 접근법은 목표 개념을 삽입하거나 제거하는 효과에만 좁게 초점을 맞추어 평가되는 경우가 많아 생성 품질을 간과합니다. 우리는 삽입 및 제거 시나리오 모두에서 다양한 컨디셔닝 방법을 체계적으로 조사했습니다. 효율적인 스티어링 방법은 종종 유창성에 큰 비용을 치르면서 컨디셔닝을 달성한다는 것을 발견했습니다. 또한, 훈련 패러다임과의 중요한 상호작용을 확인했는데, 활성화 스티어링 방법은 베이스 모델에 비해 인스트럭션 튜닝된 모델에서는 훨씬 효과가 낮습니다. 반면, 단순 프롬프트와 완전한 감독 파인튜닝은 개념 삽입에 유효한 옵션이지만 개념 제거에는 그다지 좋지 않습니다. 마지막으로, 저비용으로 계산되는 텍스트 메트릭은 비용이 많이 드는 LLM-as-judge 점수와 높은 상관관계를 보이며, 컨디셔닝 방법의 행동에 대한 통찰을 제공합니다.
주요 기여
이 논문은 다음 분야의 연구를 제시합니다:
- cs.CL
방법론
자세한 방법론은 전체 논문을 참고하십시오.
실용적 함의
이 연구는 cs.CL 분야의 발전에 기여합니다.
저자
- Iuri Macocco
- Pau Rodríguez
- Arno Blaas
- Luca Zappella
- Marco Baroni
- Xavier Suau
논문 정보
- arXiv ID: 2606.12234v1
- Categories: cs.CL
- Published: 2026년 6월 10일
- PDF: PDF 다운로드