使用scikitlearn检索错误分类的文档

Had*_*har 7 python numpy machine-learning scipy scikit-learn

我很想知道scikitlearn python模块中是否有内置函数,可以检索错误分类的文档.

这很简单我通常通过比较预测和测试向量并从测试文档数组中检索文档来自己编写.但我问它是否有内置的功能,而不是复制我写的每个python代码中的功能.

Fre*_*Foo 12

如果您有一y_test组文档的真实标签列表,例如["ham", "spam", "spam", "ham"],您将其转换为NumPy数组,那么您可以将其与单行中的预测进行比较:

import numpy as np

y_test = np.asarray(y_test)
misclassified = np.where(y_test != clf.predict(X_test))
Run Code Online (Sandbox Code Playgroud)

现在misclassified是一系列索引X_test.

@eickenberg是对的,这种东西没有在scikit-learn中实现,因为用户需要熟悉NumPy才能在几行代码中自行完成.