[Paper] ROIDS: 견고한 이상치 인식 기반 다운샘플링
Source: arXiv - 2601.19477v1
Overview
Informed down-sampling (IDS)은 다양한 선택 전략, 특히 토너먼트 선택과 결합될 때 심볼릭 회귀 성능을 향상시키는 것으로 알려져 있습니다. 그러나 최근 연구에서는 IDS의 이점이 모든 문제에 일관되게 나타나지는 않는다는 점을 발견했습니다. 우리의 분석에 따르면, 이상치(outlier)를 포함하는 문제에서는 IDS 성능이 더 낮게 나타납니다. IDS는 하위 집합에 이상치를 포함시키는 경향이 있어, GP가 이상치에 과적합(overfit)된 해를 찾도록 유도합니다.
이를 해결하기 위해 ROIDS(Robust Outlier‑Aware Informed Down‑Sampling)를 도입했습니다. ROIDS는 IDS의 샘플링 과정에서 잠재적인 이상치를 제외합니다. ROIDS를 사용하면 IDS의 장점을 유지하면서 이상치에 과적합되는 문제를 방지하고, 다양한 벤치마크 문제에서 경쟁력을 확보할 수 있습니다. 실험 결과는 ROIDS가 연구된 모든 벤치마크 문제에서 원하는 동작을 보임을 보여줍니다. ROIDS는 이상치가 추가된 합성 문제와 복잡한 실제 세계 문제 모두에서 IDS보다 일관되게 우수한 성능을 보이며, 실제 세계 벤치마크 문제의 80 % 이상에서 IDS를 능가합니다. 또한, 연구된 모든 기준 접근법과 비교했을 때, ROIDS는 테스트된 모든 벤치마크 문제에서 가장 높은 평균 순위를 기록했습니다. 이러한 견고한 동작은 데이터에 이상치가 포함될 가능성이 있을 때, 심볼릭 회귀에서 선택을 위한 신뢰할 수 있는 다운‑샘플링 방법으로 ROIDS를 만들었습니다.
Key Contributions
- cs.NE
Methodology
자세한 방법론은 전체 논문을 참고하십시오.
Practical Implications
이 연구는 cs.NE 분야의 발전에 기여합니다.
Authors
- Alina Geiger
- Martin Briesch
- Dominik Sobania
- Franz Rothlauf
Paper Information
- arXiv ID: 2601.19477v1
- Categories: cs.NE
- Published: January 27, 2026
- PDF: Download PDF