shn*_*shn 3 curve cluster-analysis false-positive confusion-matrix
假设我使用 k 均值等方法将包含 1000 个实例的 5 个类的训练数据集聚类为 5 个簇(中心)。然后,我通过在测试数据集上进行验证来构建混淆矩阵。然后我想用它绘制 ROC 曲线,怎么可能做到这一点?
Roc 曲线显示真阳性率和假阳性率之间的权衡。换句话说
ROC 图是二维图,其中 TP 率绘制在 Y 轴上,FP 率绘制在 X 轴上 ROC 图:研究人员的注释和实际考虑因素
当您使用离散分类器时,该分类器仅在 ROC 空间中生成单个点。通常你需要一个产生概率的分类器。您更改分类器中的参数,以便您的 TP 和 FP 率发生变化。之后,您可以使用这些点绘制 ROC 曲线。
假设您使用 k 均值。K 均值离散地为您提供集群成员资格。一个点属于 ClusterA 或 .. ClusterE。因此,从 k 均值输出 ROC 曲线并不简单。Lee 和 Fujita 为此描述了一种算法。你应该看看他们的论文。但算法是这样的。
正如你所看到的,他们在 ROC 空间中获得更多的点,并使用这些点来绘制 ROC 曲线
归档时间: |
|
查看次数: |
6754 次 |
最近记录: |