[Paper] 도시 규모 카메라 네트워크를 위한 Edge-Cloud 패브릭 상의 실시간 트래픽 분석 스케일링
Source: arXiv - 2603.05217v1
개요
이 논문은 AIITS를 소개한다. AIITS는 수백에서 수천 개에 이르는 도시 전역 CCTV 스트림을 실시간 분석을 위한 라이브 “traffic graph”로 변환하는 엔드‑투‑엔드 플랫폼이다. 엣지 AI(Jetson Orin)와 클라우드‑스케일 그래프 신경망(GNNs)을 긴밀히 결합함으로써, 시스템은 현대 지능형 교통 시스템(ITS)의 엄격한 지연 시간, 대역폭 및 연산 제약을 충족한다.
주요 기여
- Edge‑Cloud Fabric Architecture – 에지 디바이스에서 무거운 DNN 추론(객체 탐지 및 추적)을 수행하고, 가벼운 그래프 구축 및 시공간 예측을 클라우드로 오프로드하는 통합 파이프라인.
- Capacity‑Aware Scheduler – 이기종 에지 노드(Raspberry Pi + Jetson Orin) 간에 워크로드를 동적으로 균형 맞추어 비디오 스트림 수가 증가함에 따라 실시간 처리량을 유지한다.
- SAM3‑Assisted Continuous Labeling – Segment Anything Model (SAM3)을 기반 모델로 활용해 새로운 교통 장면을 자동 라벨링하고, 중앙 데이터 수집 없이 연합 학습 루프에 공급하여 에지 탐지기를 지속적으로 업데이트한다.
- Spatio‑Temporal GNN Forecasting – 에지에서 생성된 동적 교통 그래프를 기반으로 그래프 신경망을 사용해 실시간 현재 예측 및 단기 교통 흐름 예측을 수행한다.
- Scalable Testbed Validation – Jetson Orin 클러스터에서 >2000 FPS의 데이터 수집을 시연했으며, 벵갈루루 지역 배치에서 최대 1000개의 동시 RTSP 스트림에 대한 정확한 예측을 입증했다.
Methodology
- Video Ingestion – 수백 개의 RTSP 피드를 저비용 Raspberry Pi 게이트웨이에서 캡처하여 Jetson Orin 엣지 가속기로 전달합니다.
- Edge DNN Pipeline – 각 Jetson은 YOLO 기반 탐지기와 DeepSORT 트래커를 실행합니다. 출력은 경량 객체 트랙 세트(차량 ID, 바운딩 박스, 타임스탬프)입니다.
- Graph Construction – 트랙을 교통 그래프로 집계합니다: 노드는 도로 구간 또는 교차점을 나타내고, 엣지는 차량 흐름 수와 속도를 인코딩합니다. 이 그래프는 압축된 JSON/ProtoBuf 형식으로 클라우드에 스트리밍됩니다.
- Capacity‑Aware Scheduling – 중앙 컨트롤러가 CPU/GPU 사용량, 네트워크 대역폭, 프레임 레이트 목표를 모니터링합니다. 스트림을 엣지 노드 간에 재배치하고, 추가 Jetson을 가동하거나, 저우선순위 피드를 제한하여 지연 시간을 200 ms 미만으로 유지합니다.
- SAM3‑Assisted Labeling & Federated Learning – 주기적으로 SAM3이 새로운 프레임을 자동 세분화하여 희귀 교통 시나리오(예: 공사 구역)에 대한 의사 라벨을 생성합니다. 엣지 디바이스는 이러한 라벨을 사용해 탐지기를 로컬에서 미세 조정하고, 연합 집계자는 원본 비디오 데이터를 이동하지 않고 모델 업데이트를 병합합니다.
- Cloud ST‑GNN – 클라우드 서비스는 진화하는 교통 그래프를 받아들여 시공간 그래프 신경망(예: Graph WaveNet)을 실행해 현재 흐름(Nowcast)과 5‑15분 후 예측(Forecast)을 생성합니다. 결과는 엣지 대시보드와 교통 제어 시스템에 다시 푸시됩니다.
결과 및 발견
| 지표 | 엣지 (Jetson Orin) | 클라우드 (ST‑GNN) |
|---|---|---|
| 디바이스당 최고 FPS | 2000 FPS (≈ 60 스트림당 30 FPS) | N/A |
| 엔드‑투‑엔드 지연시간 | 120 ms (감지 → 그래프) | 80 ms (그래프 → 예측) |
| 처리량 확장성 | 5대의 Jetson과 스케줄러를 사용해 1000 스트림까지 선형 확장 | 1000노드 그래프에서 예측 정확도(MAE) < 3 veh/min |
| 모델 적응 | 지속적인 연합 업데이트로 2주 동안 감지 누락률을 12 % 감소 | 계절별 교통 패턴 변화에도 예측 오류가 안정적으로 유지됨 |
실험 결과, 엣지는 초당 수천 프레임의 실시간 처리를 지속할 수 있으며, 클라우드 GNN은 생성된 그래프를 받아들여 병목 현상 없이 정확한 단기 교통 예측을 제공함을 확인했다.
Practical Implications
- Deployable ITS Solutions – Cities can retrofit existing CCTV infrastructure with inexpensive edge boxes (Raspberry Pi + Jetson) rather than overhauling to high‑bandwidth fiber networks.
- Cost‑Effective Scaling – The capacity‑aware scheduler ensures you only add compute where needed, avoiding over‑provisioning.
- Privacy‑Preserving Analytics – Raw video never leaves the edge; only abstracted flow graphs are sent to the cloud, aligning with GDPR‑style regulations.
- Rapid Model Evolution – SAM3‑assisted labeling and federated learning let traffic operators adapt detectors to new vehicle types, road layouts, or weather conditions without central data collection.
- Integration with Existing Traffic Management – Forecasts can feed directly into adaptive signal control, congestion pricing, or incident response dashboards, enabling proactive rather than reactive traffic management.
제한 사항 및 향후 작업
- 엣지 하드웨어 의존성 – 성능은 GPU 가속 엣지 디바이스의 가용성에 좌우됩니다; 저가형 CPU는 요구되는 FPS를 충족하기 어려울 수 있습니다.
- 네트워크 변동성 – 스케줄러는 비교적 안정적인 업링크 대역폭을 전제로 합니다; 극심한 패킷 손실은 그래프 신선도를 저하시킬 수 있습니다.
- 모델 일반화 – SAM3가 라벨링에 도움을 주지만, 기본 탐지기는 여전히 비정형 장면에서의 드리프트를 방지하기 위해 주기적인 수동 검증이 필요합니다.
- 1,000 스트림 이상 확장성 – 향후 작업에서는 계층형 엣지 클러스터와 엣지‑투‑엣지 가십 프로토콜을 탐색하여 10 k 이상 스트림을 포함하는 도시 규모 배포로 한계를 확장할 예정입니다.
- 확장된 예측 수평선 – 현재 GNN은 5‑15 분 윈도우에 초점을 맞추고 있으며, 장기 교통 계획(예: 1시간 예측) 통합은 아직 연구가 필요한 영역입니다.
저자
- Akash Sharma
- Pranjal Naman
- Roopkatha Banerjee
- Priyanshu Pansari
- Sankalp Gawali
- Mayank Arya
- Sharath Chandra
- Arun Josephraj
- Rakshit Ramesh
- Punit Rathore
- Anirban Chakraborty
- Raghu Krishnapuram
- Vijay Kovvali
- Yogesh Simmhan
논문 정보
- arXiv ID: 2603.05217v1
- 카테고리: cs.DC
- 출판일: 2026년 3월 5일
- PDF: Download PDF