小编Hou*_*tni的帖子

孤立森林与鲁棒随机切割森林在异常值检测中的比较

我正在研究异常值检测中的不同方法。我遇到了 sklearn 的 Isolation Forest 实现和 Amazon sagemaker 的 RRCF(Robust Random Cut Forest)实现。两者都是基于决策树的集成方法,旨在隔离每个点。隔离步骤越多,该点就越有可能成为内点,反之亦然。

但是,即使查看了算法的原始论文,我也无法准确理解两种算法之间的区别。它们的工作方式有何不同?它们中的一个比另一个更有效吗?

编辑:我正在添加研究论文的链接以获取更多信息,以及一些讨论这些主题的教程。

隔离森林:

论文 教程

健壮的随机砍伐森林:

论文 教程

python outliers scikit-learn anomaly-detection amazon-sagemaker

3
推荐指数
1
解决办法
3259
查看次数