use*_*386 6 python machine-learning scikits scikit-learn
我正在使用scikits接口训练带有交叉验证(stratifiedKfold)的svm分类器.对于每个测试集(k),我得到一个分类结果.我想要一个包含所有结果的混淆矩阵.Scikits有一个混淆矩阵接口:sklearn.metrics.confusion_matrix(y_true,y_pred)我的问题是我应该如何累积y_true和y_pred值.它们是数组(numpy).我应该根据我的k-fold参数定义数组的大小?对于每个结果,我应该将y_true和y-pred添加到数组中?
您可以使用聚合混淆矩阵,也可以为每个 CV 分区计算一个聚合混淆矩阵,并计算矩阵中每个分量的平均值和标准差(或标准误差)作为变异性的度量。
对于分类报告,需要修改代码以接受二维输入,以便传递每个 CV 分区的预测,然后计算每个类别的平均分数和标准偏差。