[Paper] 基于黑箱损坏的生成建模:自洽随机插值
Source: arXiv - 2512.10857v1
概览
Modi 等人最新的论文解决了生成模型中的一个长期难题:在仅有受损观测的情况下学习生成干净数据。通过将腐蚀过程视为黑箱并迭代细化传输映射,作者提出了自一致随机插值(SCSI),它既能逆转腐蚀,又能作为强大的生成模型。这为那些无法收集原始训练数据的领域(如医学成像、遥感和科学模拟)打开了高质量合成的大门。
主要贡献
- 自一致随机插值 (SCSI): 一种迭代算法,仅使用受损数据集和对前向腐蚀算子的黑箱访问,就能学习受损数据与干净数据之间的传输映射。
- 理论收敛保证: 在温和的正则性假设下,迭代更新收敛到一个固定点,该点能够一致地逆转腐蚀通道。
- 计算效率: 避免昂贵的变分推断或显式似然估计;每次迭代只需从腐蚀模型采样并评估当前的传输映射。
- 广泛适用性: 能处理任意、可能高度非线性的前向模型(例如模糊、下采样、基于物理的模拟器),无需解析梯度。
- 实验优越性: 在图像去模糊、压缩感知以及科学逆问题(如层析成像、流体场重建)上展示了业界领先的重建质量。
方法论
-
问题设定 – 设 (x) 为未知的干净数据,(y = \mathcal{F}(x) + \epsilon) 为观测到的受损测量,其中 (\mathcal{F}) 是未知(或仅可黑箱调用)的前向算子,(\epsilon) 为噪声。我们拥有大量的 (y),但没有配对的 ((x, y))。
-
随机插值 – 作者从随机插值框架出发,该框架通过在随机时间变量 (t \in [0,1]) 下混合样本,构建两个分布之间的连续“桥”。
-
迭代传输更新 –
- 初始化传输映射 (T^{(0)})(例如恒等映射)。
- 在第 (k) 次迭代时,抽取一个受损样本 (y),并生成合成的干净样本 (\tilde{x}=T^{(k)}(y))。
- 将 (\tilde{x}) 送入黑箱前向模型,得到合成的受损观测 (\tilde{y} = \mathcal{F}(\tilde{x}) + \epsilon)。
- 使用配对 ((y, \tilde{y})) 计算自一致性损失,衡量映射 (T^{(k)}) 将 (y) 映射为干净样本后,其前向仿真与原始 (y) 的匹配程度。
- 通过对该损失进行随机梯度下降更新传输映射,得到 (T^{(k+1)})。
-
自一致性原理 – 损失迫使映射满足 ( \mathcal{F}(T(y)) \approx y)(在分布上),即对生成的干净样本施加前向模型应重新产生观测到的受损数据。
-
采样 – 收敛后,生成干净样本只需抽取一个受损观测(或先验样本),并应用学习得到的传输映射 (T^\star)。
结果与发现
| 任务 | 基线(变分) | SCSI(本工作) | 指标提升 |
|---|---|---|---|
| 运动模糊去模糊(CelebA) | 23.1 dB PSNR | 27.4 dB | +4.3 dB |
| 压缩感知(MNIST,10% 测量) | 92.5 % 准确率 | 96.8 % | +4.3 % |
| 层析重建(合成 CT) | 0.87 SSIM | 0.94 SSIM | +0.07 |
| 流体场推断(Navier‑Stokes) | 1.12 RMSE | 0.78 RMSE | –0.34 |
- 速度: 训练时间约比可比的基于扩散的变分方法低 30%,因为每次迭代仅需前向仿真,无需对前向模型进行反向传播。
- 鲁棒性: 当前向算子高度病态(例如严重下采样)且噪声水平在数据集中变化时,方法仍保持稳定。
- 消融实验: 去除自一致性项会导致发散,验证了其在使学习的传输映射与真实逆过程对齐中的核心作用。
实际意义
- 数据匮乏领域: 工程师现在可以仅使用传感器输出训练高保真模拟的生成模型,省去昂贵的真实标注成本。
- 逆问题流水线: SCSI 可作为学习的先验嵌入现有重建工作流,提升医学 CT、MRI 以及天文成像的图像质量,而无需重新设计基于物理的重建代码。
- 快速原型: 由于算法只需对前向模型进行黑箱调用,开发者可以在不推导解析梯度的情况下尝试新传感器或模拟器(如激光雷达、CFD)。
- 隐私保护合成: 只能共享匿名化、受损数据的组织(例如模糊人脸、加密遥测)仍可生成逼真的干净样本用于下游任务。
局限性与未来工作
- 前向模型的良好行为假设: 收敛证明依赖于 Lipschitz 连续性和噪声有界;高度混沌或不连续的模拟器可能违背这些条件。
- 对超高分辨率数据的可扩展性: 虽然比变分方法更高效,但在千兆像素图像上训练仍需大量计算和内存来存储传输映射。
- 黑箱访问成本: 在某些科学场景下,每次前向仿真代价高昂(如完整物理 PDE 求解)。未来工作可结合代理模型或多保真度策略以降低开销。
- 条件生成的扩展: 当前形式侧重于无条件合成;将 SCSI 拓展到条件任务(如类别条件生成)仍是一个开放方向。
总体而言,自一致随机插值框架为在无法获取干净数据时进行生成建模提供了一条理论扎实、实用性强的路径,预示着在工程和科学应用中的广泛收益。
作者
- Chirag Modi
- Jiequn Han
- Eric Vanden-Eijnden
- Joan Bruna
论文信息
- arXiv ID: 2512.10857v1
- 分类: cs.LG, cs.AI, stat.ML
- 发表时间: 2025 年 12 月 11 日
- PDF: Download PDF