[Paper] FairRF:多目标搜索用于单一和交叉软件公平性
发布: (2026年1月12日 GMT+8 21:42)
8 min read
原文: arXiv
Source: arXiv - 2601.07537v1
概述
本文介绍了 FairRF,一种多目标进化搜索技术,它在同步调优随机森林分类器的超参数的同时,对训练数据进行变异,以同时提升 公平性(降低偏差)和 有效性(预测准确率)。通过返回一组 Pareto 前沿 的权衡解,FairRF 让产品负责人、数据科学家和工程师能够挑选最符合其公平性‑与‑性能优先级的模型。
关键贡献
- 多目标进化搜索公平性 – 将公平性和有效性作为一等优化目标,而不是仅使用单一的事后偏差缓解步骤。
- 超参数 + 数据变异搜索 – 同时探索随机森林设置(例如树的数量、最大深度)和系统性数据转换(重新抽样、标签翻转),以降低偏差。
- Pareto 最优解集 – 提供一组模型组合,每个模型代表不同的公平性‑有效性权衡,支持利益相关者驱动的选择。
- 全面的实证评估 – 在 11 种分类场景下,与 26 种基线(包括最先进的偏差缓解方法)比较,使用五个有效性指标、三个公平性指标以及两种交叉性变体(共六种公平性定义)。
- 在交叉偏差上的卓越表现 – 超越先前在影响重叠受保护群体(例如种族 + 性别)的偏差缓解的最佳方法。
方法论
- 基学习器 – 随机森林(RF)因其流行度和灵活性而被选用。
- 搜索空间
- RF 超参数:树的数量、最大深度、最小样本分割数等。
- 数据变异算子:对少数群体进行过采样/欠采样、标签平滑、合成样本生成。
- 进化算法 – 使用多目标遗传算法(例如 NSGA‑II)进化候选配置的种群。每个候选方案在以下方面进行评估:
- 有效性 – 准确率、F1‑分数、AUC 等。
- 公平性 – 统计平等差异、均衡机会及其交叉扩展。
- Pareto 前沿提取 – 在固定代数后,返回非支配解(在两个目标上没有其他解更好)。
- 基准测试 – 作者在公开数据集(如 Adult、COMPAS)上运行 FairRF 和 26 种基线方法(预处理、在处理、后处理技术),并报告所有指标的平均排名。
结果与发现
| 指标 | FairRF 与基线对比 |
|---|---|
| 公平性提升 | 与原始随机森林相比,差异降低最高可达 +30%,相较于之前最佳的交叉性方法提升 +12%。 |
| 效能保持 | 预测准确率保持在最佳单一准确率基线的 1–2% 范围内,表明权衡成本极小。 |
| 跨定义的稳定性 | FairRF 在所有六种公平性定义上始终提供更好或相当的公平分数,而许多基线仅在单一指标上表现突出。 |
| 帕累托多样性 | 生成的前沿每次运行包含 8–12 个不同模型,为开发者提供具体选择,而不是单一的“一刀切”模型。 |
简而言之,FairRF 不仅使模型更公平,而且在不牺牲生产系统所依赖的核心预测能力的前提下实现这一点。
Source: …
实际意义
- 对开发者友好的公平性调优 – 与其手动进行重采样或添加公平约束,团队可以将 FairRF 集成到 CI 流水线中,让进化搜索自动生成一组可直接部署的模型。
- 利益相关者协商 – 产品经理可以可视化公平性‑与‑准确性权衡曲线,并基于数据做出决策(例如,“我们接受准确率下降 0.5%,以换取性别偏差降低 15%”)。
- 交叉属性合规 – 法规日益要求系统对组合受保护属性公平对待。FairRF 内置的交叉属性指标帮助满足 GDPR、EEOC 或特定行业的公平性审计要求。
- 可扩展到其他学习器 – 虽然论文聚焦于随机森林,但相同的进化框架可以封装其他基于树的集成模型(XGBoost、LightGBM)甚至神经网络,使其成为任何机器学习工具箱的多功能补充。
- 降低工程开销 – 通过自动化超参数调优和偏差缓解,团队相比运行独立的公平性专用流水线可节省时间。
限制与未来工作
- 计算成本 – 多目标进化搜索在大规模数据集上可能代价高昂;作者指出其运行时间相较于单目标调优更长。
- 随机森林聚焦 – 当前实现绑定于随机森林(RF);若要扩展到深度学习模型,可能需要重新设计变异算子。
- 度量选择 – FairRF 会优化你提供的度量;为特定领域选择合适的公平性定义仍是一个非平凡且需要领域专家参与的任务。
- 对流式数据的可扩展性 – 该方法假设训练集是静态的;未来工作可以探索增量式或在线版本,以适用于实时系统。
FairRF 展示了公平性不必是事后添加的附加组件。通过将公平性视为一等的优化目标并提供一系列权衡模型,它为开发者提供了构建大规模负责任 AI 系统所需的实用手段。
作者
- Giordano d’Alosio
- Max Hort
- Rebecca Moussa
- Federica Sarro
论文信息
- arXiv ID: 2601.07537v1
- 分类: cs.SE
- 出版时间: 2026年1月12日
- PDF: 下载 PDF