[Paper] ROIDS:鲁棒异常感知的知情下采样
Source: arXiv - 2601.19477v1
概述
已知信息下采样(Informed down-sampling,IDS)在与各种选择策略(尤其是锦标赛选择)结合时能够提升符号回归的性能。然而,最新研究发现 IDS 的收益并非在所有问题上都一致。我们的分析表明,IDS 在包含异常值的问题上表现更差。IDS 会系统性地倾向于在子集里包含异常值,这会推动遗传编程(GP)寻找过度拟合异常值的解。
为了解决这一问题,我们提出了 ROIDS(Robust Outlier-Aware Informed Down-Sampling),它在 IDS 的采样过程中排除潜在的异常值。使用 ROIDS 可以在不对异常值过拟合的前提下保留 IDS 的优势,并在广泛的基准问题上具备竞争力。这一点在我们的实验中得到了体现:ROIDS 在所有研究的基准问题上均表现出期望的行为。ROIDS 在添加异常值的合成问题以及大量复杂的真实世界问题上始终优于 IDS,在超过 80 % 的真实世界基准问题上超越 IDS。此外,与所有研究的基线方法相比,ROIDS 在所有测试的基准问题上获得了最佳的平均排名。这种稳健的表现使得 ROIDS 成为符号回归中选择过程的可靠下采样方法,特别是当数据集中可能包含异常值时。
关键贡献
- cs.NE
方法论
请参阅完整论文获取详细的方法论。
实际意义
本研究推动了 cs.NE 领域的进步。
作者
- Alina Geiger
- Martin Briesch
- Dominik Sobania
- Franz Rothlauf
论文信息
- arXiv ID: 2601.19477v1
- Categories: cs.NE
- Published: January 27, 2026
- PDF: Download PDF