[Paper] ContinuumConductor : 엣지-클라우드 연속체에서 분산 프로세스 마이닝
Source: arXiv - 2512.07280v1
Overview
Process mining은 오랫동안 모든 이벤트 로그를 단일 강력한 데이터 센터에 모은 뒤 인사이트를 추출하는 방식에 의존해 왔습니다. ContinuumConductor는 그 흐름을 뒤집습니다: 현대 IIoT 배포를 구동하는 엣지‑클라우드 연속체에서 바로 동일한 마이닝 단계를 실행하는 방법을 제시하여 프라이버시를 보존하고 지연 시간을 줄이면서도 고품질 프로세스 모델을 제공합니다.
Key Contributions
- ContinuumConductor framework – 각 마이닝 서브‑태스크(전처리, 상관관계, 발견)를 언제 그리고 어디서 (엣지, 포그, 클라우드) 실행할지 알려주는 계층형 의사결정 매트릭스.
- Trade‑off analysis – 고전적인 프로세스‑마이닝 파이프라인의 모든 단계에 대해 대역폭, 지연 시간, 컴퓨트 부하, 데이터 프라이버시 영향을 정량화.
- Decision criteria (예: 이벤트‑레이트 임계값, 리소스‑가용성 신호, 프라이버시 태그) – 런타임에 자동으로 평가될 수 있음.
- Prototype implementation – Raspberry‑Pi급 엣지 노드, 쿠버네티스 기반 포그 레이어, 중앙 클라우드 분석 서비스를 아우름.
- Real‑world validation – 내륙 항구 물류 시나리오에서 모델 정확도를 희생하지 않으면서 응답 시간 및 네트워크 사용량의 측정 가능한 향상을 입증.
Methodology
-
Layered Architecture – 저자들은 세 가지 논리적 레이어를 정의합니다:
- Edge (원시 센서 이벤트를 생성하는 자원 제한 장치).
- Fog (중간 규모 컴퓨트가 가능한, 종종 현장에 배치된 노드).
- Cloud (탄력적이고 고성능의 분석 클러스터).
-
Decision Framework – 각 마이닝 단계마다 프레임워크는 메트릭(이벤트 볼륨, CPU/메모리 압박, 프라이버시 수준, 요구 지연 시간)을 사전 설정된 임계값과 비교합니다. 결과는 배치 결정(Edge → Fog → Cloud)입니다.
-
Decentralized Mining Primitives – 팀은 핵심 마이닝 알고리즘(예: 이벤트 로그 필터링, 케이스 상관관계, Inductive Miner 기반 프로세스 발견)을 경량 마이크로서비스로 재구현하여 어느 레이어에서든 실행 가능하게 했습니다.
-
Dynamic Orchestration – 경량 컨트롤러가 실시간으로 메트릭을 모니터링하고 조건이 변하면(예: 센서 데이터 급증으로 전처리를 포그로 이동) 작업을 레이어 간에 마이그레이션합니다.
-
Evaluation Setup – 항구 운영을 모방한 합성 워크로드(컨테이너 취급, 트럭 도착, 통관 검사)를 엣지 게이트웨이 → 포그 노드 → 클라우드 클러스터 순으로 스트리밍했습니다. 동일 워크로드를 중앙에서 처리한 경우를 기준선으로 비교했습니다.
Results & Findings
| Metric | Centralized Baseline | ContinuumConductor (Edge‑Fog‑Cloud) |
|---|---|---|
| End‑to‑end latency (from event generation to model update) | 12 s | 4.3 s (≈ 64 % reduction) |
| Network traffic (uplink to cloud) | 1.8 GB/h | 0.6 GB/h (≈ 67 % saved) |
| CPU usage on edge | N/A (none) | ≤ 15 % of a Cortex‑A53 core (still leaves headroom for control loops) |
| Model fidelity (fitness & precision) | 0.94 / 0.88 | 0.93 / 0.87 (statistically indistinguishable) |
| Privacy compliance | All raw events leave the site | Sensitive fields stripped at edge; only aggregated traces sent upward |
Key takeaways
- 전처리와 케이스 상관관계를 엣지/포그로 이동하면 대역폭과 지연 시간이 크게 감소하면서도 발견된 프로세스 모델의 정확도는 동일하게 유지됩니다.
- 의사결정 프레임워크는 부하 급증에 몇 초 내에 반응하여 작업을 자동으로 재배분하고, 수동 개입이 필요 없습니다.
Practical Implications
- Real‑time process monitoring – 운영자는 중앙 서버에 배치 업로드를 기다릴 필요 없이 거의 즉시 알림(예: 병목 현상 감지)을 받을 수 있습니다.
- Data‑privacy by design – 민감한 제조 로그는 현장을 떠나지 않으며, 익명화된 고수준 트레이스만 클라우드로 전송돼 GDPR/CCPA 준수가 용이합니다.
- Cost savings – 상향 트래픽 감소는 WAN 비용 절감으로 이어지고, 엣지 수준 컴퓨트는 기존 IoT 게이트웨이에서 수행되어 비싼 클라우드 컴퓨트 급증을 피할 수 있습니다.
- Scalable IIoT pipelines – 프레임워크는 기존 엣지 오케스트레이터(K3s, Azure IoT Edge, AWS Greengrass)에 플러그인 형태로 삽입될 수 있어 개발자가 최소한의 코드 변경으로 분산 마이닝을 도입할 수 있습니다.
- Plug‑and‑play for developers – 마이크로서비스 API는 OpenAPI 사양을 따르며, 개발자는 자체 발견 알고리즘이나 맞춤형 프라이버시 필터를 오케스트레이션 로직을 건드리지 않고 교체할 수 있습니다.
Limitations & Future Work
- Resource heterogeneity – 현재 프로토타입은 비교적 균일한 엣지 하드웨어를 전제로 합니다; 극저전력 노드(예: BLE 비콘)는 여전히 모든 작업을 오프로드해야 할 수 있습니다.
- Static thresholds – 의사결정 기준은 수동으로 설정되며, 학습 기반 임계값 적응은 향후 연구 과제로 남겨졌습니다.
- Security of orchestration – 데이터 프라이버시는 다루지만, 레이어 간 작업 이동을 담당하는 제어 채널이 공격 표적이 될 수 있습니다; 강화된 인증 메커니즘이 계획되어 있습니다.
- Broader domain validation – 이번 연구는 단일 물류 사례에 초점을 맞췄으며, 향후 제조, 스마트 그리드, 의료 파이프라인에서 ContinuumConductor를 테스트할 예정입니다.
ContinuumConductor는 개발자가 프로세스 마이닝 인텔리전스를 엣지‑클라우드 시스템의 구조에 직접 삽입하도록 하여, 단일 클라우드‑전용 접근 방식이 초래하는 지연 및 프라이버시 비용 없이 원시 IoT 스트림을 실행 가능한 프로세스 인사이트로 전환할 수 있게 합니다.
Authors
- Hendrik Reiter
- Janick Edinger
- Martin Kabierski
- Agnes Koschmider
- Olaf Landsiedel
- Arvid Lepsien
- Xixi Lu
- Andrea Marrella
- Estefania Serral
- Stefan Schulte
- Florian Tschorsch
- Matthias Weidlich
- Wilhelm Hasselbring
Paper Information
- arXiv ID: 2512.07280v1
- Categories: cs.DC
- Published: December 8, 2025
- PDF: Download PDF