[논문] Socratic‑SWE: 트레이스 기반 스킬로 스스로 진화하는 코딩 에이전트

발행: (2026년 6월 6일 AM 01:00 GMT+9)
4 분 소요
원문: arXiv

출처: arXiv - 2606.07412v1

개요

LLM 기반 소프트웨어 엔지니어링 에이전트는 실제 언어 모델 능력을 평가하는 핵심 테스트베드가 되었지만, 고품질 SWE 작업의 확보가 제한적이어서 학습에 한계가 있다. 기존의 합성 데이터 생성 방법은 주로 고정된 변형이나 버그 삽입 절차를 통해 작업을 만들기 때문에, 생성된 작업 분포가 에이전트의 약점이나 학습 진행 상황과 크게 무관하다. 우리는 Socratic‑SWE라는 폐쇄형 자기 진화 프레임워크를 제안한다. 이 프레임워크는 에이전트의 과거 해결 추적(trace)을 학습 신호의 원천으로 재활용한다. 추적을 단순히 보상 계산의 근거로만 사용하는 대신, Socratic‑SWE는 이를 구조화된 에이전트 스킬로 증류하여 반복되는 실패와 효과적인 수리 패턴을 요약한다. 이러한 스킬은 실제 저장소에서 목표 수리 작업을 생성하는 데 가이드 역할을 한다. 후보 작업은 실행 기반 검증을 통해 확인되고, 솔버‑그라디언트 정렬 보상으로 점수가 매겨져, 유지되는 작업이 검증 가능하고 Solver 개선에 유용하도록 만든다. 업데이트된 Solver가 새로운 추적을 생성함으로써 작업 커리큘럼이 연속 라운드에 걸쳐 적응한다. SWE‑bench Verified, SWE‑bench Lite, SWE‑bench Pro, Terminal‑Bench 2.0 전반에 걸쳐 Socratic‑SWE는 동일한 연산 예산 하에서 자기 진화 베이스라인보다 일관되게 성능을 향상시켰으며, 세 차례 반복 후 SWE‑bench Verified에서 50.40%에 도달했다. 이러한 결과는 해결 추적이 자기 진화 SWE 에이전트를 위한 확장 가능한 기반이 될 수 있음을 시사한다.

주요 기여

이 논문은 다음 분야의 연구를 제시한다:

  • cs.SE
  • cs.AI

방법론

자세한 방법론은 전체 논문을 참고하십시오.

실용적 시사점

본 연구는 cs.SE 분야의 발전에 기여합니다.

저자

  • Chuan Xiao
  • Zhengbo Jiao
  • Shaobo Wang
  • Wei Wang
  • Bing Zhao
  • Hu Wei
  • Linfeng Zhang
  • Lin Qu

논문 정보

  • arXiv ID: 2606.07412v1
  • Categories: cs.SE, cs.AI
  • Published: June 5, 2026
  • PDF: Download PDF
0 조회
Back to Blog

관련 글

더 보기 »