[Paper] ROIDS:鲁棒异常感知的知情下采样

发布: (2026年1月27日 GMT+8 19:07)
3 分钟阅读
原文: arXiv

Source: arXiv - 2601.19477v1

概述

已知信息下采样(Informed down-sampling,IDS)在与各种选择策略(尤其是锦标赛选择)结合时能够提升符号回归的性能。然而,最新研究发现 IDS 的收益并非在所有问题上都一致。我们的分析表明,IDS 在包含异常值的问题上表现更差。IDS 会系统性地倾向于在子集里包含异常值,这会推动遗传编程(GP)寻找过度拟合异常值的解。

为了解决这一问题,我们提出了 ROIDS(Robust Outlier-Aware Informed Down-Sampling),它在 IDS 的采样过程中排除潜在的异常值。使用 ROIDS 可以在不对异常值过拟合的前提下保留 IDS 的优势,并在广泛的基准问题上具备竞争力。这一点在我们的实验中得到了体现:ROIDS 在所有研究的基准问题上均表现出期望的行为。ROIDS 在添加异常值的合成问题以及大量复杂的真实世界问题上始终优于 IDS,在超过 80 % 的真实世界基准问题上超越 IDS。此外,与所有研究的基线方法相比,ROIDS 在所有测试的基准问题上获得了最佳的平均排名。这种稳健的表现使得 ROIDS 成为符号回归中选择过程的可靠下采样方法,特别是当数据集中可能包含异常值时。

关键贡献

  • cs.NE

方法论

请参阅完整论文获取详细的方法论。

实际意义

本研究推动了 cs.NE 领域的进步。

作者

  • Alina Geiger
  • Martin Briesch
  • Dominik Sobania
  • Franz Rothlauf

论文信息

  • arXiv ID: 2601.19477v1
  • Categories: cs.NE
  • Published: January 27, 2026
  • PDF: Download PDF
Back to Blog

相关文章

阅读更多 »