如何评估无监督异常检测

el *_*sem 5 evaluation metrics artificial-intelligence machine-learning

我试图通过使用机器学习预测连续值来解决回归问题。我有一个由 6 个浮点列组成的数据集。

这些数据来自低价传感器,这说明我们很可能会拥有可以被认为与众不同的值。为了解决这个问题,在预测我的连续目标之前,我将预测数据异常,并将其用作数据过滤器,但是我拥有的数据没有标记,这意味着我有无监督的异常检测问题。

用于此任务的算法是局部异常值因子、一类 SVM、隔离森林、椭圆包络和 DBSCAN。

在拟合这些算法之后,有必要对其进行评估以选择最好的算法。任何人都可以知道如何评估异常检测的无监督算法吗?

use*_*632 0

唯一的方法是生成合成异常,这意味着在了解典型异常值的情况下自行引入异常值。