머신러닝 ‘어드벤트 캘린더’ 8일차: Excel에서 Isolation Forest

발행: (2025년 12월 9일 오전 03:26 GMT+9)
1 min read

Source: Towards Data Science

Isolation Forest

Isolation Forest는 기술적으로 보일 수 있지만, 그 아이디어는 간단합니다: 무작위 분할을 사용해 포인트를 격리하는 것입니다. 포인트가 빨리 격리되면 이상치이며, 많은 분할이 필요하면 정상적인 데이터입니다.

작은 데이터셋 1, 2, 3, 9을 사용하면 논리를 명확히 볼 수 있습니다. 여러 개의 무작위 트리를 구축하고, 각 포인트를 격리하는 데 필요한 분할 수를 측정한 뒤, 그 결과를 결합해 이상치 점수를 계산합니다. 필요한 분할 수가 적을수록 해당 포인트가 이상치일 가능성이 높아집니다.

Back to Blog

관련 글

더 보기 »

머신러닝 “Advent Calendar” Day 10: Excel에서 DBSCAN

DBSCAN은 매우 간단한 아이디어, 즉 각 점에 가까이 사는 이웃이 얼마나 있는지를 세는 것으로 우리가 얼마나 나아갈 수 있는지를 보여줍니다. 포스트 “The Machine Learning ‘Advent Calendar’ Day 1”.