[Paper] 오염된 학습 데이터를 위한 적응형 및 공격적 거부 기반 이상 탐지
Source: arXiv
Abstract
오염된 데이터를 처리하는 것은 이상 탐지에서 중요한 과제로, 전통적인 모델은 순수한 정상 데이터만을 학습한다고 가정합니다. 기존 방법들은 고정된 오염 비율에 의존하여 오염을 완화하지만, 가정된 비율과 실제 비율 사이의 차이는 특히 정상 데이터와 비정상 데이터 분포가 겹치는 잡음이 많은 환경에서 성능을 크게 저하시킬 수 있습니다. 이러한 한계를 극복하기 위해 우리는 Adaptive and Aggressive Rejection (AAR) 를 제안합니다. AAR은 수정된 z‑score와 가우시안 혼합 모델 기반 임계값을 사용하여 이상치를 동적으로 제외하는 새로운 방법입니다. AAR은 하드와 소프트 거부 전략을 통합함으로써 정상 데이터를 보존하고 이상치를 제외하는 사이의 트레이드‑오프를 효과적으로 균형 맞춥니다. 두 개의 이미지 데이터셋과 삼십 개의 표형 데이터셋에 대한 광범위한 실험 결과, AAR이 최신 방법보다 0.041 AUROC 만큼 우수함을 보여줍니다. 확장 가능하고 신뢰할 수 있는 솔루션을 제공함으로써, AAR은 오염된 데이터셋에 대한 강인성을 향상시키고 보안 및 의료와 같은 분야에서 실세계 적용 범위를 넓히는 길을 열어줍니다.
Subjects
- 기계 학습 (cs.LG)
- 인공지능 (cs.AI)
Citation
arXiv: 2511.21378 (cs.LG)
DOI
Submission History
- v1 – Wed, 26 Nov 2025 13:25:36 UTC (96 KB)