[논문] IS-CoT: 교차 구조적 사고로 장문 생성 붕괴 극복

발행: 3일 전 (2026년 6월 9일 AM 01:31 GMT+9)

3 분 소요

원문: arXiv

출처: arXiv - 2606.09709v1

개요

일관되고 제어 가능한 장문 콘텐츠 생성은 대형 언어 모델(LLM)에게 지속적인 과제입니다. 추론 강화 모델이 논리 중심 분야에서 성공을 거두었지만, 우리의 평가에서는 이 모델들이 개방형 글쓰기에서 심각한 길이 붕괴 현상을 보인다는 점을 발견했습니다. 목표 길이가 2,000단어를 초과하면 성능이 급격히 저하됩니다. 우리는 이러한 실패를 정적 계층적 계획의 한계 때문이라고 판단합니다. 정적 계획은 확장된 컨텍스트에 대해 동적인 안내를 제공하는 데 어려움을 겪습니다. 이 격차를 메우기 위해 우리는 Interleaved Structural Chain-of-Thought (IS‑CoT) 프레임워크를 도입합니다. 외부 에이전트 워크플로와 달리, IS‑CoT는 생성 과정에 동적인 계획‑작성‑반성 사이클을 내재시켜 지속적인 전략 적응과 전역 정렬을 추가적인 지원 없이 가능하게 합니다. 이 프레임워크를 기반으로 다중 교사 파이프라인을 통해 인터리브된 추론 트레이스 고품질 데이터셋을 구축하고, IS‑Writer‑8B를 학습시켰습니다. 실험 결과, IS‑Writer‑8B는 도전적인 장문 벤치마크에서 최첨단 성능을 달성했으며(예: LongBench‑Write에서 DeepSeek‑V3.2 대비 +3.08), 길이 준수와 일관성 면에서 훨씬 큰 상용 모델과 경쟁할 수 있음을 보여줍니다.

핵심 기여

이 논문은 다음 분야의 연구를 제시합니다.

cs.CL

방법론

자세한 방법론은 전체 논문을 참고하십시오.

실용적 함의

본 연구는 cs.CL 분야의 발전에 기여합니다.

저자

Zechen Sun
Yuyang Sun
Zecheng Tang
Juntao Li
Wenpeng Hu
Wenliang Chen
Zhunchen Luo
Guotong Geng
Min Zhang

논문 정보

arXiv ID: 2606.09709v1
분류: cs.CL
출판일: 2026년 6월 8일
PDF: PDF 다운로드

[논문] IS-CoT: 교차 구조적 사고로 장문 생성 붕괴 극복

개요

핵심 기여

방법론

실용적 함의

저자

논문 정보

관련 글

[논문] 완전 무작위 마스킹을 넘어: 어텐션 기반 디노이징 및 최적화, 확산 언어 모델을 위한.

[논문] 폴란드 의학 시험에서 고성능 LLM 재평가: 진정한 실력인가, 편향에 의한 성과인가?

[논문] 제3자 감사를 넘어: 사용자 중심 LLM 편향 연구를 위한 상황적 상호작용 감사

[논문] VIA‑SD: 추측 디코딩을 위한 모델 내부 라우팅 기반 검증