[Paper] Coverage-Guided 도로 선택 및 Prioritization for Efficient Testing in Autonomous Driving Systems

발행: (2026년 1월 13일 오후 11:55 GMT+9)
6 min read
원문: arXiv

Source: arXiv - 2601.08609v1

Overview

자율주행 보조 시스템(ADAS) 테스트는 방대한 작업이다—수천 개의 도로 시나리오를 실행해야 안전에 중요한 버그를 잡을 수 있다. 그러나 이러한 시나리오 중 다수가 거의 중복되어 있어 테스트 시간을 늘리지만 가치를 추가하지 않는다. 논문 *“Coverage‑Guided Road Selection and Prioritization for Efficient Testing in Autonomous Driving Systems”*는 중복 도로를 줄이고, 다양한 커버리지를 보장하며, 남은 테스트를 가장 도전적이고 실패 가능성이 높은 사례가 먼저 실행되도록 순서를 정하는 데이터‑드리븐 프레임워크를 제안한다.

주요 기여

  • 중복 인식 클러스터링 도로 시나리오를 기하학적(예: 곡률, 차선 레이아웃) 및 동적 ADAS 행동 특징(예: 조향, 속도 프로파일)으로 수행.
  • 대표 선택 각 클러스터에서 기하학적 및 행동 다양성을 유지하면서 테스트 스위트를 크게 축소.
  • 다중 요인 우선순위 지정 선택된 도로를 기하학적 복잡성, 운전 난이도, 과거 실패 빈도에 따라 순위 매김.
  • 실증 검증 OPENCAT 데이터셋 및 Udacity 자율주행 시뮬레이터에서 수행, 무작위 순서 대비 테스트 크기 89 % 감소95배 빠른 초기 실패 탐지 달성.

방법론

  1. Feature Extraction – For every road scenario, the authors compute a vector of geometric descriptors (lane curvature, intersection count, elevation changes) and dynamic descriptors derived from the ADAS’s own trajectory (steering angle variance, speed fluctuations).
  2. Clustering – Using a density‑based algorithm (e.g., DBSCAN), scenarios that are close in this combined feature space are grouped together. Each cluster represents a “type” of road‑driving interaction.
  3. Representative Picking – Within each cluster, the scenario that is most central (minimum average distance to other members) is chosen as the cluster’s representative. This guarantees that the reduced suite still covers the full spectrum of road‑behavior patterns.
  4. Prioritization Scoring – A weighted score is computed for each representative:
    • Geometric complexity (sharp turns, many lane changes)
    • Driving difficulty (high variance in speed/steering)
    • Historical failure rate (how often the ADAS previously crashed on similar roads)
      The scores are sorted descending, yielding the final execution order.
  5. Evaluation – The pipeline is applied to two ADAS implementations (a lane‑keeping controller and a combined lane‑keeping + adaptive cruise control) and the results are compared against a random baseline and a naïve “first‑come‑first‑served” ordering.

결과 및 발견

MetricRandom BaselineProposed Framework
테스트 스위트 크기 감소≈ 89 % 적은 시나리오
보존된 실패 사례~30 %≈ 79 % 원래 실패
조기 실패 감지 (첫 실패까지 시간)Baseline최대 95× 빠름
평균 우선순위 향상 (탐지 곡선 아래 면적)0.120.78

쉽게 말해, 이 접근법은 실행 횟수를 거의 한 단계(10배) 정도 줄이면서도 대부분의 버그를 잡아내며, 가장 통과하기 어려운 케이스들을 거의 즉시 찾아냅니다.

Practical Implications

  • Faster CI pipelines – 팀은 클러스터링‑선택 단계를 지속적 통합(CI) 워크플로에 통합하여 회귀 테스트 시간을 몇 시간에서 몇 분으로 단축할 수 있습니다.
  • Resource‑efficient simulation – 클라우드 기반 시뮬레이션 팜은 빌드당 GPU/CPU 사용 시간을 줄여 비용을 절감할 수 있습니다.
  • Targeted safety analysis – 복잡도가 높고 실패율이 높은 도로를 조기에 드러냄으로써 엔지니어는 가장 중요한 부분에 디버깅 노력을 집중할 수 있어 근본 원인 분석을 가속화합니다.
  • Dataset curation – 클러스터링 로직을 재활용하여 공개 도로 시나리오 데이터셋을 정리하고 균형을 맞출 수 있어 새로운 ADAS 모델 벤치마킹에 더 유용하게 만들 수 있습니다.

제한 사항 및 향후 연구

  • Feature dependence – 클러스터링 품질은 선택된 기하학 및 동적 기술자에 의존한다; 이국적인 도로 특성(예: 날씨 효과)은 아직 포착되지 않는다.
  • Static weighting – 우선순위 가중치는 수동으로 설정된다; 실시간 실패 로그에서 이러한 가중치를 적응적으로 학습하면 견고성을 향상시킬 수 있다.
  • Scalability to massive fleets – OPENCAT(~10k 시나리오)에서는 효과적이지만, 저자들은 수백만 시나리오와 같은 초대형 코퍼스에서는 계층적 클러스터링이나 스트리밍 알고리즘이 필요할 수 있다고 언급한다.
  • Generalization across ADAS types – 연구는 차선 유지와 어댑티브 크루즈 컨트롤에 초점을 맞추었으며, 인식 중심 모듈(예: 객체 탐지)으로 확장하는 것은 아직 미해결 과제로 남아 있다.

저자

  • Qurban Ali
  • Andrea Stocco
  • Leonardo Mariani
  • Oliviero Riganelli

논문 정보

  • arXiv ID: 2601.08609v1
  • 분류: cs.SE
  • 출판일: 2026년 1월 13일
  • PDF: PDF 다운로드
Back to Blog

관련 글

더 보기 »