[논문] 소프트웨어 공학을 위한 LLM의 구조화된 출력 제어 실증 연구
개요
소프트웨어 엔지니어링에서 LLM이 생성한 출력은 거의 독립적으로 존재하지 않는다. 이러한 출력은 엄격하고 종종 조직 고유의 구조적 계약을 부과하는 툴체인, API, 데이터 파이프라인에 연결되어야 한다. 기대되는 형식을 위반하는 의미적으로 올바른 출력은 소비 시스템 입장에서는 잘못된 답과 구별이 되지 않으며, 따라서 구조적 충실성은 실무에서 LLM을 배포하기 위한 운영 전제 조건이 된다. 그럼에도 현재 모델들은 구문적으로 잘못되었거나 구조적으로 비준수한 출력을 빈번히 생성한다. 인코더와 달리 자동회귀 디코더는 전역이 아닌 지역적인 초점으로 토큰을 하나씩 생성하기 때문에, 목표 형식이 학습 데이터의 일반적인 분포와 달라질 때 구조적 취약성이 증폭된다. 우리는 네 가지 대표적인 SE 작업에 대해 구조적 신뢰성을 체계적으로 평가하고, 실패를 구문 오류, 구조 오류, 의미 오류로 구분한다. 디코더를 대상으로 하는 완화 방법들을 벤치마크했으며, 여기에는 문법 제약 디코딩, 정규식 기반 검증, 그리고 엄격한 템플릿 기반 제어(Template Token Match Generation, TTMG)가 포함된다. TTMG는 구문 오류를 거의 완전히 제거하지만, 여전히 상당한 구조 및 의미 오류가 남아 있어 핵심 병목이 단순한 구문 포맷을 넘어선다는 것을 보여준다. 상세한 사례 연구는 잔여 오류가 하위 워크플로우에서 어떻게 연쇄적으로 영향을 미치는지를 추가로 설명한다. 우리의 결과는 현재 구조 강제 도구들이 필요하지만 충분하지 않으며, LLM 기반 워크플로우에서 구조적 충실성과 의미적 정확성을 동시에 보장할 접근법이 필요함을 강조한다.
주요 기여
이 논문은 다음 분야의 연구를 제시한다.
- cs.SE
방법론
자세한 방법론은 전체 논문을 참고하십시오.
실용적 함의
이 연구는 cs.SE 분야의 발전에 기여합니다.
저자
- Yewei Song
- Prateek Rajput
- Tiezhu Sun
- Saad Ezzini
- Tegawendé F. Bissyandé
- Jacques Klein
논문 정보
- arXiv ID: 2606.09395v1
- Categories: cs.SE
- Published: 2026년 6월 8일
- PDF: PDF 다운로드