[논문] SentTrack: GitHub 이슈 저장소에서 감성 기반 병목 탐지

발행: (2026년 6월 10일 AM 07:12 GMT+9)
4 분 소요
원문: arXiv

개요

소프트웨어 엔지니어링 팀은 작업을 조정하고 버그를 보고하며 기술적 결정을 협상하기 위해 GitHub 이슈 스레드에 점점 더 의존하고 있지만, 대부분의 저장소 건강 도구는 코드 메트릭에만 초점을 맞추고 개발을 촉진하거나 방해하는 대화 역학을 무시한다. 본 논문은 GitHub 이슈 토론에서 사회‑기술적 병목 현상을 감지하기 위한 이중 렌즈 프레임워크인 SentTrack을 제시한다. 약 9,000개의 이슈 스레드에 걸친 AvaloniaUI 오픈소스 저장소에 적용한 결과, 이 프레임워크는 다음 세 가지 질문에 답한다: 실시간 대화 데이터를 통해 워크플로우 비효율성을 자동으로 탐지하는 방법, 감성 신호가 전통적인 라벨 기반 방법보다 위험을 더 빨리 포착할 수 있는지 여부, 그리고 혼합 미디어 이슈 텍스트에서 인간 서술을 기계 생성 잡음으로부터 분리하는 방법.

SentTrack은 두 개의 보완적인 파이프라인을 결합한다. 수평 파이프라인은 대규모 언어 모델을 사용해 원시 이슈 보고서를 깔끔한 요약으로 변환하고, 중간 수준의 관심 구문을 추출한 뒤 UMAP과 HDBSCAN을 통해 클러스터링한다. 첫 3,608개의 이슈를 처리해 613개의 의미 클러스터를 생성하였다. 수직 파이프라인은 ABCDE 협업 상호작용 프레임워크를 적용해 각 댓글을 분류하고 스레드 수준의 결과를 추론한다. 전체 코퍼스에서 49%의 스레드가 정체 상태에 머물렀고, 오직 13%만이 해결에 도달했으며, 해결 격차가 주요 병목 신호로 확인되었다. 부정성, 정체, 해결 격차, 스레드 길이를 결합한 가중 점수 엔진은 유지보수자가 개발이 정체되기 전에 마찰이 큰 논의를 식별하고 우선순위를 매길 수 있는 해석 가능한 도구를 제공한다.

주요 기여

이 논문은 다음 분야의 연구를 제시합니다:

  • cs.SE

방법론

자세한 방법론은 전체 논문을 참고하시기 바랍니다.

실용적 시사점

본 연구는 cs.SE 분야의 발전에 기여한다.

저자

  • Xinyu Hu
  • Ali Behbahani
  • Daniel Moon
  • Yaren Dogan
  • Nasir U. Eisty

논문 정보

  • arXiv ID: 2606.11476v1
  • Categories: cs.SE
  • Published: 2026년 6월 9일
  • PDF: PDF 다운로드
0 조회
Back to Blog

관련 글

더 보기 »