[Paper] 카메라 RGB‑NIR에서 화재 감지

발행: (2025년 12월 30일 오전 01:48 GMT+9)
6 min read
원문: arXiv

Source: arXiv - 2512.23594v1

Overview

이 논문은 컴퓨터 비전 기반 화재 모니터링에서 지속적으로 제기되는 문제, 즉 RGB‑NIR(근적외선) 카메라를 사용해 야간에 화염을 신뢰성 있게 탐지하는 문제를 다룹니다. 부족한 NIR 데이터를 보강하고, 두 단계 검출 파이프라인을 도입하며, YOLO의 패치 기반 변형을 제안함으로써, 저자들은 기존 최고 성능을 뛰어넘는 탐지 정확도를 달성하고 밝은 인공 조명에 의해 발생하는 오경보를 감소시켰습니다.

주요 기여

  • 확장된 NIR 데이터셋 – 공개적으로 이용 가능한 야간 시야 화재 이미지 부족을 완화하기 위해 선별하고 대폭 증강함.
  • 2단계 탐지 파이프라인 – 빠른 YOLOv11 프런트엔드와 경량 EfficientNetV2‑B0 분류기를 결합하여 인공 조명으로 인한 false positive를 필터링함.
  • Patched‑YOLO – 고해상도 RGB 프레임을 겹치는 패치로 분할하는 새로운 전처리 방식으로, 탐지기가 작거나 먼 불꽃을 더 잘 포착하도록 함.
  • 포괄적인 벤치마크 – 최신 탐지기(YOLOv7, RT‑DETR, YOLOv9)를 새로운 데이터셋에서 재평가하여 mAP₅₀₋₉₅에서 일관된 향상을 보여줌.

방법론

  1. 데이터 수집 및 증강

    • 제어된 화재 훈련 현장에서 야간 투시 카메라로 촬영한 원시 NIR 영상을 수집했습니다.
    • 기하학적(회전, 스케일링), 광도학적(밝기/대비 변동) 및 도메인 특화 증강(시뮬레이션 연기, 렌즈 플레어)을 적용하여 학습 데이터를 확장했습니다.
  2. 두 단계 탐지

    • Stage 1: YOLOv11이 전체 프레임 RGB‑NIR 합성 이미지에서 실행되어 빠르게 바운딩 박스를 제안합니다.
    • Stage 2: 각 제안 영역을 잘라 EfficientNetV2‑B0에 입력하면 “화재” 또는 “비화재”(예: 가로등)로 분류합니다. 이 경량 네트워크는 GPU에서 병렬로 실행되어 지연 시간을 낮게 유지합니다.
  3. RGB용 Patched‑YOLO

    • 입력 이미지를 겹치는 패치(예: 640 × 640, 20 % 겹침)로 타일링합니다.
    • YOLO가 각 패치를 독립적으로 처리하고, 패치 경계에서 비최대 억제(NMS)를 사용해 탐지를 병합합니다.
    • 이 전략은 메모리 사용량을 크게 늘리지 않으면서 고해상도 디테일을 유지합니다.

All training used the standard COCO‑style loss functions, with additional weighting to penalize false positives on artificial lights.

결과 및 발견

모델 (입력 크기)mAP₅₀₋₉₅ (RGB)mAP₅₀₋₉₅ (NIR)오탐률 (조명)
YOLOv7 (640 × 1280)0.510.4418 %
RT‑DETR (640 × 640)0.650.5812 %
YOLOv9 (640 × 640)0.5980.5514 %
Two‑stage (YOLOv11 + EffV2‑B0)0.710.686 %
Patched‑YOLO (RGB only)0.73
  • 두 단계 파이프라인은 가장 강력한 베이스라인 대비 전체 mAP을 약 10 % 향상시키면서 야간 인공 조명에 대한 오탐률을 절반으로 낮춥니다.
  • Patched‑YOLO는 일반 YOLOv11에 비해 작고 먼 불꽃 탐지를 약 8 % mAP 상승시켰으며, 추론 시간은 RTX 3080 기준 프레임당 약 12 ms로 크게 증가하지 않았습니다.

실용적 함의

  • Fire‑monitoring systems은 이제 경량 EfficientNetV2‑B0 분류기 덕분에 엣지 디바이스(예: NVIDIA Jetson)에서 실시간 성능으로 실행될 수 있습니다.
  • Reduced false alarms는 소방대의 불필요한 출동을 줄여 비용 절감과 자동 감시에 대한 신뢰도를 높입니다.
  • Patch‑based processing은 작은 객체가 중요한 모든 고해상도 RGB 탐지 작업(예: 야생동물 탐지, 드론 기반 검사)에 적용할 수 있습니다.
  • 확장된 NIR 데이터셋은 관용적인 라이선스로 공개되어 개발자에게 야간 시야 AI 연구를 위한 즉시 사용 가능한 벤치마크를 제공합니다.

제한 사항 및 향후 작업

  • 현재 NIR 데이터는 여전히 제한된 통제된 화재 훈련 현장 집합에서 유래하며, 급격히 변하는 야외 환경(비, 안개)에서의 성능은 아직 테스트되지 않았습니다.
  • Patched‑YOLO는 탐지 결과를 병합하기 위한 추가 기록 작업을 도입하는데, 이는 매우 저전력 CPU에서 병목 현상이 될 수 있습니다.
  • 저자들은 두 번째 단계에 transformer 기반 백본을 탐색하고, 시간적 일관성(비디오 수준 스무딩)을 통합하여 잘못된 탐지를 더욱 억제할 계획입니다.

저자

  • Nguyen Truong Khai
  • Luong Duc Vinh

논문 정보

  • arXiv ID: 2512.23594v1
  • 분류: cs.CV
  • 출판일: 2025년 12월 29일
  • PDF: Download PDF
Back to Blog

관련 글

더 보기 »