[Paper] 基于后悔的联邦因果发现(未知干预)

发布: (2025年12月30日 GMT+8 01:30)
7 min read
原文: arXiv

Source: arXiv - 2512.23626v1

Overview

联邦因果发现旨在在不移动原始数据的情况下,从分布在众多设备或机构上的数据中学习因果关系。现有方法假设每个参与者共享相同的底层因果图,但当例如医院采用不同的治疗方案(相当于未知干预)时,这一假设会失效。本文提出 I‑PERI,一种联邦算法,即使每个客户端的数据因其自身的隐藏干预而被微妙地改变,也能揭示更丰富的因果结构。

关键贡献

  • 新颖的联邦算法 (I‑PERI) 首先为所有客户端图的并集学习一个 CPDAG,然后通过利用未知客户端层面干预导致的差异来细化边的方向。
  • Φ‑Markov 等价类的定义 及其紧凑表示 Φ‑CPDAG,当存在异构干预时,它比传统的 CPDAG 更严格。
  • 理论保证:分布式学习过程的收敛性以及形式化的隐私界限(基于后悔的分析表明跨轮次的信息泄露有限)。
  • 实证验证 在合成联邦数据集上进行,展示 I‑PERI 在恢复正确边方向方面优于忽视干预异质性的基线联邦因果发现方法。
  • 开源实现(随论文发布),可与流行的联邦学习框架(如 TensorFlow Federated、PySyft)集成。

方法论

  1. 本地阶段 – 结构学习

    • 每个客户端在自己的数据上运行标准的因果发现例程(例如 PC 或 GES),生成本地 CPDAG。
    • 本地算法是 干预无关 的:它将数据视为纯观测数据,这在真实干预未知的情况下是安全的。
  2. 全局聚合 – 联合 CPDAG

    • 服务器收集本地 CPDAG(仅收集图的骨架和边的标记,不收集原始数据)。
    • 通过对所有骨架取并集、对边的方向取交集,构建一个 全局 CPDAG,捕获在任意客户端出现的每条边。
  3. 干预利用 – Φ‑方向

    • I‑PERI 利用这样一个事实:对某节点的未知干预会在 干预后 的图中去除指向该节点的所有入边。
    • 通过比较不同客户端之间边的有无,算法推断哪些边必然被干预“切断”,从而对先前模糊的边进行定向。
    • 该步骤迭代进行:每轮定向后,精炼后的图会重新广播给客户端进行本地更新,随时间降低 regret。
  4. 隐私保护通信

    • 仅交换图的摘要(边列表);没有原始特征值离开客户端。
    • 作者证明了算法的 regret 满足类似差分隐私的界限,表明攻击者无法从交换的消息中重建客户端的确切干预模式。

结果与发现

指标基线 (Fed‑PC)I‑PERI(提出)
边缘精度(方向)0.620.84
结构汉明距离(SHD)12.35.1
收敛所需通信轮次158
隐私遗憾(越低越好)0.270.09
  • 更紧的等价类:I‑PERI 恢复的 Φ‑CPDAG 平均比标准 CPDAG 少 30 % 的无向边,意味着已知的因果方向更多。
  • 对噪声的鲁棒性:即使 20 % 的客户端存在伪干预(随机删除边),I‑PERI 仍显著优于基线。
  • 可扩展性:在最多 50 个客户端和 100 个变量的实验中,得益于本地优先的设计,通信开销呈线性增长,运行时间呈次线性增长。

Source:

实际意义

  • 医疗分析:医院可以在不暴露患者记录的前提下协同学习因果路径(例如,再入院的风险因素),并自动考虑不同的治疗方案。
  • A/B 测试平台:在不同地区进行异构实验的公司可以融合因果洞察,而无需透露各变体的部署位置。
  • 边缘 AI 与物联网:执行本地干预的设备(例如,更改传感器行为的固件更新)仍然能够贡献到全局因果模型,从而实现更好的故障诊断和预测性维护。
  • 监管合规:通过将数据交换限制在图结构并提供形式化的隐私后悔界限,I‑PERI 符合 GDPR 风格的数据最小化要求。

开发者可以将 I‑PERI 插入现有的联邦流水线,使用提供的 Python API 将常规的“平均模型权重”步骤替换为“合并因果图”步骤,从而在不牺牲隐私的前提下获得更丰富的可解释性。

限制与未来工作

  • Synthetic focus:评估仅限于模拟数据;需要在真实世界部署(例如,多医院研究)中验证其对混乱、非高斯噪声的鲁棒性。
  • Assumption of acyclicity:I‑PERI 继承了有向无环图(DAG)的限制;循环因果结构(在反馈系统中常见)仍不在研究范围内。
  • Intervention detection granularity:该方法能够推断某个节点上发生了干预,但无法识别具体的干预类型或幅度。
  • Future directions:作者提出的未来工作包括扩展框架以处理 latent confounders、集成 differential privacy mechanisms 以提供更强的隐私保证,以及在 large‑scale real federated datasets(例如国家健康登记)上进行测试。

作者

  • Federico Baldo
  • Charles K. Assaad

论文信息

  • arXiv ID: 2512.23626v1
  • 分类: cs.AI, cs.LG
  • 出版日期: 2025年12月29日
  • PDF: Download PDF
Back to Blog

相关文章

阅读更多 »