在使用隔离森林进行数据异常检测时,我们应该仅使用正常数据还是混合使用正常数据和异常数据来训练模型?另外,多变量数据异常检测的最佳算法是什么?我想要最少的误报。
注意:我知道减少误报是调整模型的问题,但我想知道最有效的算法。从博客中我了解到 IsolationForest 是最新、最有效的无监督异常检测算法之一。
machine-learning random-forest anomaly-detection
anomaly-detection ×1
machine-learning ×1
random-forest ×1