[Paper] IOTEL:用于生成 IoT 丰富的面向对象事件日志的工具

发布: (2026年3月9日 GMT+8 10:59)
6 分钟阅读
原文: arXiv

Source: arXiv - 2603.07906v1

概述

本文介绍了 IOTEL,这是一款轻量级工具,能够自动将物联网(IoT)传感器流与现有的面向对象的事件日志(OCEL)融合。通过此方式,它使得过程挖掘从业者能够在无需自定义模式或大量原始数据转储的负担下,使用真实设备数据丰富日志,从而为对物联网增强的业务流程进行更深入的分析打开了大门。

关键贡献

  • 统一的 OCEL‑基础格式:扩展标准 OCEL 架构,将 IoT 测量直接嵌入传统过程事件中。
  • 自动化数据映射流水线:解析异构 IoT 流(MQTT、CSV、JSON),并使用可配置的匹配规则将其与过程对象(如订单、机器)对齐。
  • 可扩展的日志生成:有选择地聚合传感器读数(例如每个时间窗口的最小/平均/最大值),在保持分析价值的同时使日志规模可控。
  • 工具与 UI:提供基于网页的界面,用于加载源日志、定义映射策略、预览丰富后的日志,并导出供下游挖掘工具(如 ProM、PM4Py)使用。
  • 真实场景验证:在制造业案例研究中展示工作流,将温度、振动和能耗数据与生产 OCEL 合并,揭示隐藏的瓶颈。

方法论

  1. Input Acquisition – Users supply (i) an existing OCEL file describing the business process and (ii) one or more IoT data sources (live streams or archived files).
  2. Schema Normalisation – IoT payloads are normalised into a common measurement representation (timestamp, sensor‑ID, value, unit).
  3. Object‑IoT Alignment – A rule engine matches each measurement to a process object based on identifiers (e.g., RFID tag ↔ product ID) or contextual heuristics (e.g., proximity, time windows).
  4. Aggregation & Filtering – To avoid log explosion, the tool aggregates measurements per object per activity (e.g., average temperature during “Assembly”). Users can also filter by sensor type or threshold.
  5. OCEL Enrichment – The enriched events are written back into the OCEL JSON structure as additional attributes under the relevant object IDs, preserving compatibility with existing process‑mining libraries.
  6. Export & Visualization – The final IoT‑enriched OCEL can be exported for downstream analysis; the UI also offers quick visual checks (timeline plots, heatmaps).

结果与发现

  • 日志大小缩减:与直接追加原始传感器行相比,IOTEL 的聚合将丰富日志的大小降低了 ≈70 %,同时保留了 >90 % 的方差,足以进行典型 KPI 计算。
  • 改进的流程洞察:在制造案例中,将温度峰值与 “Welding” 活动关联,发现了一个先前未知的过热问题,该问题导致了 12 % 的返工事件。
  • 工具兼容性:生成的 OCEL 文件成功导入 ProM 和 PM4Py,实现了标准面向对象的挖掘(例如一致性检查、性能分析),无需任何自定义解析器。
  • 用户接受度:一项简短的用户研究(n = 8 位流程分析师)给出了 4.5/5 的可用性评分,突出了直观的映射 UI 和即时的可视化反馈。

实际意义

  • 更快的 IoT‑流程集成:开发者现在可以将传感器数据直接接入现有的过程挖掘流水线,而无需构建定制的 ETL 作业,从而加速概念验证周期。
  • 可扩展监控:通过在活动层面进行聚合,组织能够实时监控设备健康,同时保持存储和计算成本低廉。
  • 跨域分析:以 OCEL 为中心的方法使得将 IoT 数据与其他面向对象的日志(例如案例文件、资源日志)轻松结合,支持更丰富的多视角分析,例如“机器振动如何影响订单交付时间”。
  • 供应商中立的解决方案:由于 IOTEL 输出标准 OCEL,它可与任何支持该格式的过程挖掘工具配合使用,保护投资免受供应商锁定的风险。

限制与未来工作

  • 映射复杂性:当前规则引擎处理直接的标识符连接;更复杂的语义匹配(例如模糊位置推断)需要人工介入。
  • 实时流处理:IOTEL 侧重于批量增强;将其扩展到连续流场景(例如基于 Kafka 的管道)留待未来开发。
  • 领域泛化:验证仅限于制造业场景;在物流、医疗或智慧城市等领域的更多案例研究将强化其广泛适用性的论断。
  • 高级分析集成:未来版本可以将开箱即用的分析功能(例如异常检测)直接嵌入 UI,将增强日志转化为可操作的仪表盘,而不仅仅是数据源。

作者

  • Jia Wei
  • Xin Su
  • Chun Ouyang

论文信息

  • arXiv ID: 2603.07906v1
  • 分类: cs.SE
  • 出版日期: 2026年3月9日
  • PDF: 下载 PDF
0 浏览
Back to Blog

相关文章

阅读更多 »