[Paper] 反事实公平性与图不确定性

发布: (2026年1月7日 GMT+8 01:33)
7 min read
原文: arXiv

Source: arXiv - 2601.03203v1

请提供您希望翻译的具体文本内容,我将为您翻译成简体中文。

概述

本文介绍了 Counterfactual Fairness with Graph Uncertainty (CF‑GU),这是一种在底层因果结构未知的情况下审计机器学习模型偏差的新方法。通过显式考虑因果图中的不确定性,该方法提供了更可靠的公平性评估,可在实际部署中得到信赖。

关键贡献

  • 图感知公平审计 – 将反事实公平性(CF)扩展至处理一组可能的因果图分布,而不是单一假设图。
  • 自助抽样因果发现 – 使用受领域知识约束的因果发现算法生成一组候选 DAG(“袋子”),以捕获结构不确定性。
  • 定量不确定性度量 – 引入归一化的 Shannon 熵来衡量候选图之间的分歧程度。
  • 置信区间约束的 CF 指标 – 为标准 CF 分数(例如反事实差异)提供统计置信区间,以反映图的不确定性。
  • 实证验证 – 在合成数据上展示不同知识假设如何影响审计结果,并在真实数据集(COMPAS、Adult)上证明该方法即使在极少先验知识的情况下,也能以高置信度定位已知偏差。

方法论

  1. 领域知识约束 – 实践者提供少量高层因果假设(例如,“年龄不能由性别导致”)。
  2. 带自助抽样的因果发现 – 在每次重新抽样的数据上运行标准因果发现算法(如 PC 或 GES),每次都遵守提供的约束。这会产生一组可行的有向无环图(DAG)。
  3. 图不确定性量化 – 对于每条边,计算其在 DAG 包中出现的频率;这些频率的归一化 Shannon 熵作为单一标量,概括整体不确定性。
  4. 反事实公平性评估 – 对每个候选 DAG,计算常规的 CF 指标(在对受保护属性进行反事实改变后模型预测的差异)。
  5. 置信区间 – 使用 DAG 包中 CF 分数的分布构建置信区间,给出在图不确定性下真实公平度可能落入的范围。

该流水线刻意保持模块化:任何因果发现工具和任何 CF 指标都可以替换,使方法能够适应不同领域和公平性定义。

结果与发现

  • 合成实验 – 当真实因果图已知时,CF‑GU 的置信区间能够紧密包围真实的 CF 分数。若所施加的领域知识过于薄弱或相互矛盾,熵值会升高,区间随之变宽,正确地提示审计可信度低。
  • COMPAS 数据集 – 即使仅使用少量约束(例如“前科发生在再犯之前”),CF‑GU 仍能识别出种族对风险评分的统计显著不公平影响,且结果与先前的法医分析相吻合。
  • Adult 收入数据集 – 该方法在预测收入时标记出与性别相关的差异,并给出狭窄的置信界限,尽管因果图大体上仍然模糊不清。
  • 在这两个真实数据集上,归一化熵保持在适度范围(≈0.2–0.35),表明仅需少量领域知识即可缩小可行图的范围,并提供可操作的公平性洞察。

实际意义

  • 稳健的公平审计 – 团队现在可以在不必“猜测”精确因果图的情况下运行 CF 检查,从而降低错误公平声明的风险。
  • 迭代模型改进 – 熵度量告诉工程师在信任审计之前是否需要收集更多领域知识或数据,从而指导数据收集的优先级。
  • 合规监管 – 置信区间限制的公平度量与新兴的审计标准相契合,这些标准要求报告可量化的不确定性。
  • 工具集成 – 由于 CF‑GU 基于现成的因果发现库构建,可嵌入现有的机器学习流水线(例如,作为 MLflow 或 Kubeflow 中的训练后验证步骤)。
  • 跨领域适用性 – 无论是信用评分还是招聘算法,只要受保护属性与复杂因果网络相互作用的场景,都能受益于这种考虑不确定性的方法。

限制与未来工作

  • 可扩展性 – 在大规模、高维数据集上进行因果发现的自举可能计算密集;作者指出需要更高效的采样或并行化策略。
  • 依赖领域约束 – 虽然实验中最小约束已足够,但选择不当或相互矛盾的约束可能误导 DAG 包的生成。
  • 单一公平度量 – 本研究聚焦于反事实差异;将框架扩展到其他公平概念(例如人口统计平等、均衡误差率)仍是未解之路。
  • 真实世界因果验证 – 未来工作可以整合专家获取的因果先验或干预数据,以进一步收紧图包并降低熵。

作者

  • Davi Valério
  • Chrysoula Zerva
  • Mariana Pinto
  • Ricardo Santos
  • André Carreiro

论文信息

  • arXiv ID: 2601.03203v1
  • 分类: cs.LG, cs.AI, cs.CY
  • 发布日期: 2026年1月6日
  • PDF: 下载 PDF
Back to Blog

相关文章

阅读更多 »