[Paper] VETime:视觉增强零样本时间序列异常检测

发布: (2026年2月19日 GMT+8 02:22)
7 分钟阅读
原文: arXiv

Source: arXiv - 2602.16681v1

概述

本文介绍了 VETime,一种将原始时间序列数据与视觉表示相融合以实现 零样本异常检测 的新框架。通过将细粒度的时间线索与基于图像的上下文对齐,VETime 弥合了点级精度与全局模式感知之间长期存在的权衡,在无需任何特定任务训练的情况下提供了强大的检测性能。

关键贡献

  • First multimodal TSAD architecture:首个多模态 TSAD 架构,通过可逆图像转换管线同时利用 1‑D 时间信号和 2‑D 视觉模式。
  • Patch‑Level Temporal Alignment (PTA) 模块:创建共享的视觉‑时间轴时间线,保留每个时间戳的细节,同时实现全局上下文建模。
  • Anomaly Window Contrastive Learning (AWCL):让模型在没有标注异常的情况下学习区分正常窗口和异常窗口。
  • Task‑Adaptive Multi‑Modal Fusion (TAMF):根据每个输入片段的特征动态加权时间特征和视觉特征。
  • Zero‑shot capability:系统可直接在未见过的数据集上使用,超越最先进基线且比纯视觉方法消耗更少的计算资源。

方法论

  1. 可逆图像转换 – 将原始序列重新塑形为二维“图像”(例如通过 Gramian Angular Field 或 Recurrence Plot),并且可以无损恢复,确保视觉处理永不丢失时间忠实度。
  2. 补丁级时间对齐 – 将图像划分为补丁;每个补丁通过轻量对齐网络关联到其原始时间戳,生成同时尊重空间和时间顺序的联合嵌入。
  3. 双分支骨干网络
    • 时间分支:轻量的 1‑D Transformer 或 CNN,擅长点式异常评分。
    • 视觉分支:预训练的 Vision Transformer(ViT),捕获整个序列的长程模式。
  4. 异常窗口对比学习 – 在预训练阶段,随机抽取的窗口标记为“正常”或“合成异常”(通过扰动生成)。模型学习将正常窗口的嵌入拉近,而将包含异常的窗口的嵌入推远。
  5. 任务自适应多模态融合 – 门控机制评估每个分支在给定窗口上的置信度,并融合它们的异常得分,使系统在处理尖锐突变时依赖时间分支,在捕捉细微漂移时依赖视觉分支。

所有组件在通用时间序列语料库上一次性训练;在新数据集上的推理实现 零样本 部署——无需微调。

结果与发现

数据集 (Zero‑Shot)F1‑Score (点)F1‑Score (窗口)平均推理时间 (ms)
NAB (真实世界)0.840.7812
UCR Anomaly Suite0.810.7415
Yahoo S50.790.7113
  • VETime 优于最佳 1‑D 基线(如 LSTM‑AD、TCN),在 F1 上提升 7–12 %,同时匹配或超越仅视觉模型(如 TimeGAN‑ViT),后者需要大量微调。
  • 动态融合 相比单独使用任一分支,可将噪声点异常的误报率降低约 30 %。
  • 在计算上,VETime 的运行速度约为纯视觉管线的 2 倍,因为视觉分支只处理紧凑的图像(通常为 64 × 64),而时间分支仅处理短时补丁。

实际意义

  • 即插即用的异常监控:DevOps 团队可以将 VETime 嵌入现有遥测管道(例如 Prometheus、Grafana),并立即开始检测峰值和渐进漂移,无需标注数据。
  • 边缘部署:轻量级的时间分支和适中的镜像大小保持低内存占用,使其在 IoT 网关或设备端健康监控中可行。
  • 跨领域复用:由于模型以 zero‑shot 方式训练,同一检查点可用于日志、传感器流、金融行情数据,甚至用户行为指标,节省领域特定模型训练的成本。
  • 提升警报精度:细粒度对齐意味着警报可以精确定位到具体时间戳,这对需要了解异常何时开始的自动化修复脚本至关重要。

限制与未来工作

  • 可逆图像转换目前依赖固定变换(例如 Gramian Angular Field);更具表达力、可学习的编码可以捕获更丰富的动态。
  • 虽然零样本性能强劲,作者指出在超高频数据上视觉分辨率成为瓶颈,导致性能略有下降。
  • 未来研究方向包括将框架扩展到 多变量 系列,处理异构采样率,并探索 自监督 异常合成技术,以进一步降低对手工扰动的依赖。

作者

  • Yingyuan Yang
  • Tian Lan
  • Yifei Gao
  • Yimeng Lu
  • Wenjun He
  • Meng Wang
  • Chenghao Liu
  • Chen Zhang

论文信息

  • arXiv ID: 2602.16681v1
  • 分类: cs.CV
  • 发布时间: 2026年2月18日
  • PDF: 下载 PDF
0 浏览
Back to Blog

相关文章

阅读更多 »