[Paper] 面向可解释临床决策评分的符号回归

发布: 1周前 (2025年12月9日 GMT+8 03:00)

7 min read

原文: arXiv

Source: arXiv - 2512.07961v1

概览

本文介绍了 Brush，一种新颖的符号回归算法，它将决策树式的规则划分与连续参数优化相结合。通过这种方式，Brush 能够自动发现 可解释的临床评分系统——即医生依赖的风险方程，同时仍能提供具有竞争力的预测性能。

搜索空间设计 – Brush 将模型视为一棵树，内部节点是 逻辑谓词（例如 age > 65），叶节点是 连续表达式（例如 0.23 * serum_creatinine）。这种混合表示使算法能够捕获规则逻辑和光滑的非线性关系。
进化优化 – 该算法使用基于种群的搜索（遗传编程）来演化候选树。
- 交叉与变异 在树结构上操作（添加/删除谓词、交换子树）。
- 局部常数优化 在每次结构变化后，对每个叶子的数值参数运行无梯度优化器（如 CMA‑ES），确保连续部分得到精细调优。
多目标评估 – 每个候选模型在两个目标上打分：（a）预测误差（如交叉熵损失），（b）模型复杂度（节点数）。维护 Pareto 前沿，使用户能够在满足期望精度的前提下挑选最简模型。
验证 – 实验在 SRBench（符号回归任务集合）以及两个真实临床数据集上进行。采用标准的训练/验证/测试划分和重复交叉验证，以防止过拟合。

基准	Brush vs. 最佳 SR 方法	vs. 决策树	vs. 随机森林
SRBench（平均）	误差降低 +4.2 %，节点数减少 ‑30 %	误差相当，节点数减少 ‑45 %	AUC 相似，节点数减少 ‑60 %
临床评分 1（如 CHA₂DS₂‑VASc）	0.96 AUC（原始 0.95）	0.94 AUC	0.97 AUC
临床评分 2（如 APACHE‑II）	0.89 AUC（原始 0.88）	0.85 AUC	0.90 AUC

快速原型化风险评分：数据科学家只需将患者数据输入 Brush，即可得到可直接使用、面向临床的评分规则，无需手工特征工程。
合规友好：输出为透明的数学表达式，满足许多审计和可解释性要求，而黑箱模型往往难以做到。
与现有流水线集成：Brush 是纯 Python 库，兼容 numpy、pandas 与 scikit‑learn API，易于嵌入 ETL 或模型部署流程。
降低维护成本：更简洁的模型意味着运行时依赖更少、推理延迟更低——这对床旁决策支持系统或移动健康应用尤为关键。
跨领域潜力：虽然本文聚焦临床评分，但相同的混合 SR 方法同样适用于任何规则逻辑（如欺诈检测阈值）与连续预测变量共存的场景。

Brush 为数据驱动、但完全可解释的临床决策工具打开了新局面。对于希望在健康科技产品中嵌入可信 AI 的开发者而言，它提供了一个兼具透明度和 Python 化工作流的有力替代方案，相较于不透明的集成模型，维护更简便且性能依然出色。