[논문] GitHub 저장소에서 AI 사용의 특성 및 진화에 관한 실증 연구: 코드 주석을 통한 증거
개요
개발자들은 일상적인 소프트웨어 워크플로우에서 ChatGPT, Copilot, Claude와 같은 AI 도구를 점점 더 많이 사용하고 있지만, 기존 연구들은 대부분 LLM의 출력을 별도로 평가하고 실제 프로젝트에서 개발자들이 이를 어떻게 적용하는지는 살펴보지 못했습니다. 우리는 AI 사용을 명시적으로 언급한 35,361개의 GitHub 코드 주석과 해당 코드 블록을 분석했습니다. 먼저 500개의 고유한 주석과 코드 블록을 오픈코딩하여 AI 지원 개발 활동의 분류 체계를 도출하고, 두 개의 LLM 기반 분류기를 이용해 전체 데이터셋에 라벨을 달았으며 Dawid‑Skene 기대‑최대화 방법으로 예측을 집계했습니다. 또한 12,996개의 후속 커밋 메시지를 분석해 AI 지원 코드가 도입된 이후 어떻게 진화하는지 조사하고, 2022년 12월부터 2026년 3월까지의 시간적 추세를 살펴보았습니다. 결과는 개발자들이 주로 LLM을 코드 구현에 활용하고, 그 다음으로 코드 개선, 디버깅, 문서화, 테스트에 사용한다는 것을 보여줍니다. 이후 커밋에서는 리팩터링·정리, 기능 통합·확장, 버그 수정이 빈번히 이루어져 AI 지원 코드를 인간이 지속적으로 감독하고 조정하고 있음을 나타냅니다. 시간이 흐르면서 AI를 언급한 주석은 직접적인 코드 생성에서 지식·개념 지원 및 코드 개선으로 점차 이동합니다. 이러한 발견은 AI 도구가 단순히 코드 생성 보조를 넘어, 개발자가 시간이 지나면서 결과물을 다듬고 확장하며 수정하는 협업 지원 메커니즘으로 자리 잡아가고 있음을 시사합니다.
주요 기여
이 논문은 다음 분야의 연구를 제시합니다.
- cs.SE
방법론
자세한 방법론은 전체 논문을 참고하십시오.
실용적 시사점
이 연구는 cs.SE 분야의 발전에 기여합니다.
저자
- Abdullah Al Mujahid
- Preetha Chatterjee
- Mia Mohammad Imran
논문 정보
- arXiv ID: 2606.06843v1
- 분류: cs.SE
- 출판일: 2026년 6월 5일
- PDF: PDF 다운로드