[Paper] Fusion-SSAT：通过特征融合释放自监督辅助任务的潜力，以实现通用深度伪造检测

发布: 1个月前 (2026年1月3日 GMT+8 02:47)

7 分钟阅读

原文: arXiv

Source: arXiv - 2601.00789v1

概述

深度伪造检测模型在面对与其训练数据不同的视频时，往往会失效。Fusion‑SSAT 的作者提出了一种巧妙的方法，通过将检测器与自监督辅助任务配对，然后融合学习到的特征图，以提升检测器的鲁棒性。其结果是一个在未见过的深度伪造数据集上泛化能力显著提升的模型，超越了当前最先进的检测器。

自监督辅助任务集成 – 证明精心选择的辅助任务可以作为深度伪造检测的正则化器。
特征融合架构 (Fusion‑SSAT) – 引入一个轻量级模块，将主检测头和自监督头的表征进行拼接并联合处理。
广泛的跨数据集评估 – 在七个公开的深度伪造基准上验证该方法（DF‑40、FaceForensics++、Celeb‑DF、DFD、FaceShifter、UADFV，以及内部数据集）。
最先进的泛化能力 – 在跨数据集设置中显示出相较于最佳已发布检测器的一致提升，同时不牺牲数据集内的准确率。
训练计划的消融研究 – 分析了多种多任务训练方案（顺序、同步、交替），并确定了该问题最有效的方案。

主要任务 – 一个传统的二分类器，用于从面部视频帧中预测“真实”或“伪造”。
辅助自监督任务 – 作者使用拼图重建任务：模型接收被打乱的面部块并必须预测正确的空间顺序。这迫使网络学习细粒度的空间线索，这些线索同样对发现操纵伪造有用。
双分支骨干网络 – 两个任务共享一个通用 CNN 编码器（例如 ResNet‑50）。在编码器之后，网络分成两个头部：一个用于检测损失，另一个用于自监督损失。
特征融合 – 在最终分类层之前，将两个头部的特征图拼接，并通过一个小的融合块（1×1 卷积 + 批归一化）进行处理。该混合表示捕获了两个目标的互补信息。
训练调度 – 最有效的调度方式是在两个任务之间交替 mini‑batch（即一个 batch 更新检测损失，下一个 batch 更新自监督损失）。这使得两个目标保持“同步”，同时避免梯度干扰。

整个流水线保持端到端可训练，并且相较于普通检测器仅增加约 10 % 的额外参数。

跨数据集提升：当模型在从未见过的训练数据集上进行测试时（例如，在 FaceForensics++ + Celeb‑DF 上训练，在 DF‑40 上测试），收益最大。
消融实验：去除融合块会使跨数据集准确率下降约 4 %，确认混合表示是关键驱动因素。
训练调度影响：交替小批次的方式在泛化方面比同时的多任务损失加权提升约 2 %。

总体而言，Fusion‑SSAT 在对未见深度伪造生成方法的鲁棒性上实现了约 7 % 的绝对提升。

对于构建内容审核流水线的开发者而言，Fusion‑SSAT 提供了一套切实可行的方案，使模型能够面向深度伪造合成技术的快速演进进行前瞻性防护。

作者建议探索多模态辅助任务以及用于训练计划的自动化课程学习，作为有前景的后续步骤。