[Paper] Patch-Discontinuity Mining用于通用Deepfake检测

发布: (2025年12月26日 GMT+8 21:18)
8 min read
原文: arXiv

Source: arXiv - 2512.22027v1

概述

深度伪造生成工具已经变得非常先进,以至于即使是经验丰富的分析师也很难辨别真实与伪造的面孔。论文 Patch‑Discontinuity Mining for Generalized Deepfake Detection 介绍了 GenDF,一个精简的框架,它在仅添加少量可训练参数的情况下,重新利用大规模视觉主干网络进行深度伪造检测。作者展示了该方法显著提升了跨域鲁棒性——即它在模型从未见过的伪造技术上也能表现良好。

关键贡献

  • 通用检测流水线 (GenDF):将冻结的高容量视觉 Transformer 与一个极小的任务特定头部(约 0.28 M 可训练参数)相耦合。
  • Patch‑discontinuity 挖掘:一种自监督信号,迫使模型关注相邻图像块之间的细微不一致——这些是合成伪造的典型特征。
  • 特征空间再分配:一种轻量级对齐步骤,降低训练(源)数据与未见(目标)篡改之间的域差距。
  • 分类不变增强:一种无参数策略,在保持类别语义的同时扰动特征表示,提升泛化能力且无需额外可学习权重。
  • 跨域性能领先:在多个基准套件(如 FaceForensics++、Celeb-DF、DeepFakeDetection)上实现最先进的跨域表现,同时保持模型体积极小。

方法论

  1. Backbone selection – 作者使用预训练的大型视觉模型(例如在 ImageNet‑21k 上训练的 Vision Transformer)作为主干。所有主干权重均被冻结,以保持训练成本低廉并继承丰富的视觉先验。
  2. Patch‑discontinuity mining – 将输入的人脸图像划分为重叠的 patch。模型学习突出 discontinuities——即纹理、光照或几何的突变,这类现象在真实照片中不常见,却在 GAN 生成的人脸中普遍出现。实现方式是使用对比损失,使同一真实图像的 patch 彼此靠近,而与伪造图像的 patch 拉开距离。
  3. Feature‑space redistribution – 在提取出 patch 级别的嵌入后,使用轻量的线性投影重新平衡真实与伪造特征的分布,实质上对两类特征进行“中心化”,从而降低域迁移的影响。
  4. Classification‑invariant augmentation – 训练期间,对特征向量进行随机扰动(例如 dropout‑style 掩码或噪声),但不改变其底层标签。由于增强在特征空间完成,既不增加额外参数,又迫使分类器依赖更稳健的线索。
  5. Tiny classifier head – 在重新分布后的特征上方放置一个两层 MLP(≈0.28 M 参数),这是唯一可训练的组件,输出二元的真实/伪造得分。

得益于冻结的主干和极小的头部,整个流水线可以在单个 GPU 上端到端训练数小时完成。

结果与发现

设置指标 (AUC)相较于之前的SOTA的提升
跨域(在 FaceForensics++ 上训练,在 Celeb‑DF 上测试)0.94+4.2 %
跨操作(在 DeepFakeDetection 上训练,在未见过的 GAN 变体上测试)0.92+3.7 %
参数数量0.28 M (trainable)~20× fewer than competing methods
推理延迟≈12 ms / image on RTX 3080Comparable to lightweight CNNs

关键要点:

  • Patch‑discontinuity 信号捕捉到的伪造痕迹即使在生成器更新后仍然存在。
  • 冻结主干网络并牺牲性能;相反,它可以防止对源伪造风格的过拟合。
  • 模型保持实时推理速度,使其适用于设备端或流媒体场景。

实际意义

  • 即插即用检测 – 开发者可以将预训练的视觉变换器直接嵌入现有流水线,只微调一个小的头部,从而大幅降低工程工作量和计算成本。
  • 边缘部署 – 由于可训练参数少于 0.3 M 且延迟低于 15 ms,GenDF 可在智能手机、浏览器(通过 WebGL/ONNX.js)或低功耗边缘设备上运行,实现实时视频审核。
  • 稳健的内容审核 – 需要在不断变化的威胁环境中标记深度伪造的平台可以依赖 GenDF 对未见合成技术的泛化能力,从而降低频繁模型再训练的需求。
  • 开源友好性 – 由于模型主体被冻结,代码库体积小,审计更容易,也不太会受到大型专有数据集相关的许可问题的影响。

限制与未来工作

  • 面向人脸的聚焦 – 当前设计假设有良好对齐的人脸裁剪;对全身或非人类内容的深度伪造检测仍未探索。
  • 依赖大型预训练骨干网络 – 虽然训练成本低廉,但初始骨干网络仍需大量内存,这可能成为超轻量级 IoT 设备的障碍。
  • 静态图像评估 – 论文在单帧上进行评估;将不连续性挖掘扩展到时间线索(例如闪烁或运动不一致)可能进一步提升视频级检测。
  • 对抗鲁棒性 – 作者指出,针对性的对抗攻击仍可能欺骗冻结的骨干网络;未来工作可结合对抗训练或进行鲁棒性认证。

总体而言,GenDF 证明了自监督补丁分析、特征对齐与最小微调的智能组合,能够提供一种既 可泛化资源高效 的深度伪造检测器——这是面向真实世界安全工具的有前景方向。

作者

  • Huanhuan Yuan
  • Yang Ping
  • Zhengqin Xu
  • Junyi Cao
  • Shuai Jia
  • Chao Ma

论文信息

  • arXiv ID: 2512.22027v1
  • 分类: cs.CV
  • 出版时间: 2025年12月26日
  • PDF: Download PDF
Back to Blog

相关文章

阅读更多 »