如何分析混淆矩阵?

min*_*nks 4 python matrix confusion-matrix scikit-learn

当我打印出scikit-learn的混淆矩阵时,我收到一个非常庞大的矩阵.我想分析什么是真正的积极因素,真正的消极因素等.我该怎么办?这就是我的混淆矩阵的样子.我希望更好地理解这一点.

[[4015  336    0 ...,    0    0    2]
 [ 228 2704    0 ...,    0    0    0]
 [   4    7   19 ...,    0    0    0]
 ..., 
 [   3    2    0 ...,    5    0    0]
 [   1    1    0 ...,    0    0    0]
 [  13    1    0 ...,    0    0   11]]
Run Code Online (Sandbox Code Playgroud)

Ami*_*ory 6

IIUC,您的问题未定义."误报","真正的否定" - 这些是仅为二元分类定义的术语.阅读有关混淆矩阵定义的更多信息.

在这种情况下,混淆矩阵的尺寸为NXN.对于条目(i,i),每个对角线表示预测为i并且结果也是i的情况.任何其他非对角线条目表示一些错误,其中预测为i且结果为j.在这种情况下,"积极"和"消极"没有任何意义.

您可以轻松地找到诊断元素np.diagonal,然后,很容易将它们相加.错误情况的总和是矩阵减去对角线总和的总和.