机器学习“降临节日历”第8天:Excel中的Isolation Forest
发布: (2025年12月9日 GMT+8 02:26)
1 min read
Source: Towards Data Science
Isolation Forest
Isolation Forest 看起来可能很技术化,但其思想很简单:使用随机划分来隔离数据点。如果一个点被快速隔离,它就是异常点;如果需要很多划分才能隔离,它就是正常点。
使用小数据集 1, 2, 3, 9,我们可以清晰地看到其逻辑。我们构建若干随机树,测量隔离每个点所需的划分次数,然后将结果组合起来计算异常分数。所需划分次数越少,点是离群点的可能性就越高。