[Paper] MAC:一个包含多归因机制下标签的转化率预测基准
发布: (2026年3月3日 GMT+8 02:51)
8 分钟阅读
原文: arXiv
Source: arXiv - 2603.02184v1
概述
本文介绍了 MAC,这是首个公开可用的转化率(CVR)基准,提供由 多种 归因机制(例如,最后点击、首次点击、时间衰减)生成的标签。通过将同一用户旅程呈现给多个“视角”的转化,MAC 使得 多归因学习(MAL) 成为可能——即训练能够同时推理不同业务逻辑定义的转化的模型。作者还发布了 PyMAL,一个开源库,集合了一套基准 MAL 算法和可复现研究的实用工具。
关键贡献
- MAC 数据集:一个大规模、真实世界的 CVR 基准,包含来自多种归因方案的转化标签,填补了 MAL 研究长期存在的数据空白。
- PyMAL 库:一个可直接使用的 Python 包(基于 PyTorch),实现了广泛的 MAL 基线、评估指标和数据加载器。
- 全面的实证研究:系统实验揭示了关于何时以及如何使用 MAL 改善 CVR 预测的三个实用洞见。
- 不对称专家混合(MoAE):一种新颖的 MAL 架构,通过显式地将多归因知识学习与主任务推断分离,超越了先前的最新技术水平。
- 开源发布:基准和库均公开托管,鼓励社区贡献和公平比较。
方法论
- 数据构建 – 作者从工业广告日志(≈ 数亿次广告展示)开始。对于每个用户会话,他们根据几种常见的归因规则(最后点击、首次点击、线性、时间衰减等)计算转化标签。得到的数据集包含共享特征集(用户、广告、上下文)以及多个二元目标,每个归因方法对应一个目标。
- 多归因学习 (MAL) – 与为每个目标训练独立模型不同,MAL 将辅助归因目标视为辅助任务,在多任务学习 (MTL) 框架下进行。主要任务通常是业务关键的归因(例如最后点击),而其他任务提供额外的监督信号。
- 基线套件 – PyMAL 实现了多种 MTL 策略:硬参数共享、软共享(通过注意力或门控),以及近期的 MAL‑专用设计(如共享专家层、任务特定头部)。
- 提出的架构 – MoAE
- 非对称专家:为每个归因标签设立独立的专家子网络,使模型能够捕捉归因特定的模式。
- 混合层:门控网络学习对每个任务以不同方式组合专家输出,确保主要任务能够有选择地利用最相关的辅助知识。
- 训练目标:二元交叉熵损失的加权和,采用动态加权以避免过度强调噪声较大的辅助任务。
所有实验均在 MAC 基准上运行,使用相同的数据划分和超参数搜索协议,以保证公平比较。
结果与发现
| 设置 | 指标 (AUC) | 相对增益 vs. 单任务 |
|---|---|---|
| 最后点击(主)+ 所有辅助任务 | 0.842 | +3.1 % |
| 第一次点击(主)+ 所有辅助任务 | 0.781 | ‑1.2 %(下降) |
| 长转化路径(≥ 5 次点击) | 0.867 | +5.4 % |
| 短转化路径(≤ 2 次点击) | 0.803 | +1.8 % |
- 大多数归因设置都有一致的提升,尤其在用户旅程较长且噪声较大时。
- 目标复杂度重要:当主目标“困难”(如最后点击)时,增加更多辅助任务有帮助,但对更简单的目标(如第一次点击)可能导致下降,凸显需要谨慎选择辅助任务。
- 设计原则得到验证: (1) 完整的多归因知识学习(专用专家)和 (2) 知识利用(任务感知混合)都是必不可少的。
- MoAE 性能:在主任务上比之前最佳的 MAL 方法提升约 ≈ 2.3 % 的绝对 AUC,并在不同归因变体下表现出更好的稳定性。
实际意义
- 更好的 ROI 估算 – 广告主可以训练一个模型,同时预测在多种归因规则下的转化,从而降低维护多个模型的开销。
- 改进的竞价算法 – 实时竞价系统可以将更丰富的多归因预测输入其效用函数,进而实现更细致的预算分配(例如,倾向于在长期归因下可能转化的用户)。
- 降低数据工程工作量 – 使用 MAC 和 PyMAL,数据团队可以快速原型化 MAL 流水线,而无需构建自定义的多任务框架。
- 模型可解释性 – 非对称专家结构提供了一种自然的方式来检查哪些归因信号驱动了预测,有助于调试和合规报告。
- 可扩展部署 – MoAE 的模块化专家可以独立剪枝或量化,从而支持符合延迟约束的边缘或云端部署策略。
限制与未来工作
- 领域特定性 – MAC 来源于单一的电子商务广告平台;其向其他领域(例如 SaaS、游戏)的可迁移性仍需验证。
- 标签噪声 – 归因标签是对真实因果影响的启发式近似;噪声辅助信息会降低性能,如在 first‑click 中所见。
- 静态加权 – 当前的损失加权方案是启发式的;更复杂的元学习或强化学习方法可以自适应地平衡任务。
- 专家的可扩展性 – 随着归因机制数量的增加,专家池可能变得难以管理;未来工作可以探索参数高效的专家共享或稀疏技术。
作者鼓励社区在 MAC 上加入更多归因方案,测试 MAL 在其他下游任务(例如用户流失预测),并探索基于 PyMAL 框架的更丰富的架构变体。
作者
- Jinqi Wu
- Sishuo Chen
- Zhangming Chan
- Yong Bai
- Lei Zhang
- Sheng Chen
- Chenghuan Hou
- Xiang‑Rong Sheng
- Han Zhu
- Jian Xu
- Bo Zheng
- Chaoyou Fu
论文信息
- arXiv ID: 2603.02184v1
- 分类: cs.LG, cs.AI
- 出版日期: 2026年3月2日
- PDF: 下载 PDF