[Paper] Patch-Discontinuity Mining用于通用Deepfake检测

发布: 1个月前 (2025年12月26日 GMT+8 21:18)

8 分钟阅读

原文: arXiv

Source: arXiv - 2512.22027v1

概述

深度伪造生成工具已经变得非常先进，以至于即使是经验丰富的分析师也很难辨别真实与伪造的面孔。论文 Patch‑Discontinuity Mining for Generalized Deepfake Detection 介绍了 GenDF，一个精简的框架，它在仅添加少量可训练参数的情况下，重新利用大规模视觉主干网络进行深度伪造检测。作者展示了该方法显著提升了跨域鲁棒性——即它在模型从未见过的伪造技术上也能表现良好。

关键贡献

通用检测流水线 (GenDF)：将冻结的高容量视觉 Transformer 与一个极小的任务特定头部（约 0.28 M 可训练参数）相耦合。
Patch‑discontinuity 挖掘：一种自监督信号，迫使模型关注相邻图像块之间的细微不一致——这些是合成伪造的典型特征。
特征空间再分配：一种轻量级对齐步骤，降低训练（源）数据与未见（目标）篡改之间的域差距。
分类不变增强：一种无参数策略，在保持类别语义的同时扰动特征表示，提升泛化能力且无需额外可学习权重。
跨域性能领先：在多个基准套件（如 FaceForensics++、Celeb-DF、DeepFakeDetection）上实现最先进的跨域表现，同时保持模型体积极小。

方法论

Backbone selection – 作者使用预训练的大型视觉模型（例如在 ImageNet‑21k 上训练的 Vision Transformer）作为主干。所有主干权重均被冻结，以保持训练成本低廉并继承丰富的视觉先验。
Patch‑discontinuity mining – 将输入的人脸图像划分为重叠的 patch。模型学习突出 discontinuities——即纹理、光照或几何的突变，这类现象在真实照片中不常见，却在 GAN 生成的人脸中普遍出现。实现方式是使用对比损失，使同一真实图像的 patch 彼此靠近，而与伪造图像的 patch 拉开距离。
Feature‑space redistribution – 在提取出 patch 级别的嵌入后，使用轻量的线性投影重新平衡真实与伪造特征的分布，实质上对两类特征进行“中心化”，从而降低域迁移的影响。
Classification‑invariant augmentation – 训练期间，对特征向量进行随机扰动（例如 dropout‑style 掩码或噪声），但不改变其底层标签。由于增强在特征空间完成，既不增加额外参数，又迫使分类器依赖更稳健的线索。
Tiny classifier head – 在重新分布后的特征上方放置一个两层 MLP（≈0.28 M 参数），这是唯一可训练的组件，输出二元的真实/伪造得分。

得益于冻结的主干和极小的头部，整个流水线可以在单个 GPU 上端到端训练数小时完成。

结果与发现

设置	指标 (AUC)	相较于之前的SOTA的提升
跨域（在 FaceForensics++ 上训练，在 Celeb‑DF 上测试）	0.94	+4.2 %
跨操作（在 DeepFakeDetection 上训练，在未见过的 GAN 变体上测试）	0.92	+3.7 %
参数数量	0.28 M (trainable)	~20× fewer than competing methods
推理延迟	≈12 ms / image on RTX 3080	Comparable to lightweight CNNs

关键要点：

Patch‑discontinuity 信号捕捉到的伪造痕迹即使在生成器更新后仍然存在。
冻结主干网络并不牺牲性能；相反，它可以防止对源伪造风格的过拟合。
模型保持实时推理速度，使其适用于设备端或流媒体场景。

实际意义

即插即用检测 – 开发者可以将预训练的视觉变换器直接嵌入现有流水线，只微调一个小的头部，从而大幅降低工程工作量和计算成本。
边缘部署 – 由于可训练参数少于 0.3 M 且延迟低于 15 ms，GenDF 可在智能手机、浏览器（通过 WebGL/ONNX.js）或低功耗边缘设备上运行，实现实时视频审核。
稳健的内容审核 – 需要在不断变化的威胁环境中标记深度伪造的平台可以依赖 GenDF 对未见合成技术的泛化能力，从而降低频繁模型再训练的需求。
开源友好性 – 由于模型主体被冻结，代码库体积小，审计更容易，也不太会受到大型专有数据集相关的许可问题的影响。

限制与未来工作

面向人脸的聚焦 – 当前设计假设有良好对齐的人脸裁剪；对全身或非人类内容的深度伪造检测仍未探索。
依赖大型预训练骨干网络 – 虽然训练成本低廉，但初始骨干网络仍需大量内存，这可能成为超轻量级 IoT 设备的障碍。
静态图像评估 – 论文在单帧上进行评估；将不连续性挖掘扩展到时间线索（例如闪烁或运动不一致）可能进一步提升视频级检测。
对抗鲁棒性 – 作者指出，针对性的对抗攻击仍可能欺骗冻结的骨干网络；未来工作可结合对抗训练或进行鲁棒性认证。

总体而言，GenDF 证明了自监督补丁分析、特征对齐与最小微调的智能组合，能够提供一种既 可泛化 又 资源高效 的深度伪造检测器——这是面向真实世界安全工具的有前景方向。

作者

Huanhuan Yuan
Yang Ping
Zhengqin Xu
Junyi Cao
Shuai Jia
Chao Ma

论文信息

arXiv ID: 2512.22027v1
分类: cs.CV
出版时间: 2025年12月26日
PDF: Download PDF

[Paper] Patch-Discontinuity Mining用于通用Deepfake检测

概述

关键贡献

方法论

结果与发现

实际意义

限制与未来工作

作者

论文信息

相关文章

[Paper] 少看，准看：双向感知塑形用于多模态推理

[Paper] ProEdit：基于反演的编辑，从 Prompt 正确实现

[Paper] 通过轨迹-检测匹配学习关联用于多目标跟踪

[Paper] Yume-1.5：文本控制的交互式世界生成模型