[Paper] 自适应与激进拒绝的异常检测用于受污染的训练数据
发布: (2025年11月26日 GMT+8 21:25)
2 min read
原文: arXiv
Source: arXiv
摘要
处理受污染的数据在异常检测中是一个关键挑战,因为传统模型假设在纯正的正常数据上进行训练。传统方法通过依赖固定的污染比例来缓解污染问题,但假设的比例与实际比例之间的差异可能会严重削弱性能,尤其是在正常数据和异常数据分布重叠的噪声环境中。为了解决这些局限性,我们提出了 自适应与激进拒绝 (Adaptive and Aggressive Rejection, AAR),一种使用改进的 z‑score 和基于高斯混合模型阈值动态排除异常的新方法。AAR 通过整合硬拒绝和软拒绝策略,有效平衡了保留正常数据与排除异常之间的权衡。对两个图像数据集和三十个表格数据集的广泛实验表明,AAR 在 AUROC 提升 0.041 上优于最先进的方法。通过提供可扩展且可靠的解决方案,AAR 提升了对受污染数据集的鲁棒性,为安全、医疗等领域的更广泛实际应用铺平了道路。
主题
- 机器学习 (cs.LG)
- 人工智能 (cs.AI)
引用
arXiv: 2511.21378 (cs.LG)
DOI
提交历史
- v1 – 2025年11月26日 星期三 13:25:36 UTC (96 KB)