[논문] 효율성 다듬기: 효율적인 코드 생성을 위한 구조화된 스켈레톤 지도

발행: (2026년 6월 5일 AM 10:49 GMT+9)
4 분 소요
원문: arXiv

출처: arXiv - 2606.06821v1

개요

대규모 언어 모델(LLM)은 구문적으로 올바르고 기능적으로 완전한 프로그램을 생성할 수 있어 소프트웨어 개발을 크게 효율화합니다. 그러나 최근 연구에 따르면 이러한 프로그램은 인간이 최적화한 코드에 비해 실행 속도가 현저히 느린 경우가 많습니다. 효율성 격차를 메우기 위한 기존 접근법은 주로 생성된 코드를 반복적으로 최적화하거나, 효율적인 코드 집합을 이용해 모델을 파인튜닝하는 방식에 의존합니다. 이러한 방법들은 완전하고 최적화된 솔루션을 모방함으로써 모델에 효율성 신호를 제공하지만, 높은 실행 성능을 달성하기 위해 필수적인 구조적 코드 패턴을 명시적으로 인코딩하지는 못합니다. 이 격차를 해소하려면 두 가지 핵심 과제가 남아 있습니다: (1) 복잡한 구문 및 제어 흐름에 내재된 잠재적인 효율 지향 구조 패턴을 추출·표현하는 일, 그리고 (2) 이러한 패턴을 LLM의 의미 학습을 불안정하게 만들지 않으면서 효과적으로 학습하는 일. 이러한 과제를 해결하기 위해 우리는 EffiSkel을 제안합니다. EffiSkel은 효율성 스켈레톤—효율적인 코드를 뒷받침하는 추상적이고 재사용 가능한 구조 패턴—을 명시적으로 추출하고 학습하는 프레임워크로, 세 가지 상보적인 전략을 활용합니다. 이 스켈레톤들은 코드 생성과 스켈레톤 예측을 동시에 최적화하는 다중 과제 학습 체계에 통합됩니다. 여러 프로그래밍 언어와 벤치마크에 걸친 실험 결과, EffiSkel은 기능 정확도와 효율성을 모두 크게 향상시킴을 확인했습니다. 특히 Mercury와 DeepSeek‑Coder (7B) 조합에서 **Efficiency Ratio (ER)**가 EffiCoder 대비 +11.11%, CodeDPO 대비 +3.71% 상승했으며, **Average Speedup (AS)**는 EffiCoder 대비 +0.36, CodeDPO 대비 +0.22 증가했습니다. 이러한 결과는 효율성 스켈레톤을 명시적으로 모델링함으로써 LLM이 생성하는 코드의 실행 성능을 개선할 수 있음을 강조합니다.

주요 기여

이 논문은 다음 분야의 연구를 다룹니다:

  • cs.SE

방법론

자세한 방법론은 전체 논문을 참고하십시오.

실용적 함의

본 연구는 cs.SE 분야의 발전에 기여합니다.

저자

  • Yu Yu
  • Zhihong Sun
  • Jia Li
  • Yao Wan
  • Chuanyi Li
  • Hongyu Zhang
  • Ruyun Wang
  • Tao Huang
  • Zhi Jin
  • Ge Li
  • Chen Lyu

논문 정보

  • arXiv ID: 2606.06821v1
  • 분류: cs.SE
  • 발행일: 2026년 6월 5일
  • PDF: Download PDF
0 조회
Back to Blog

관련 글

더 보기 »