McNemar在Python中的测试和分类机器学习模型的比较

Yo *_*iao 10 python statistics classification machine-learning text-classification

是否有一个很好的McNemar测试在Python中实现?我没有在Scipy.stats或Scikit-Learn中看到它.我可能忽略了其他一些好的套餐.请推荐.

McNemar的测试几乎是用于比较给定保持测试集的两种分类算法/模型的测试(不是通过K折叠或重采样方法来模拟测试集).两种常见的替代方案是:用于比较直接真实正比例p_Ap_B来自两种算法和模型的t检验,A以及B1)假设方差遵循二项分布或2)使用重复重采样序列和测试集来估计方差.

然而,后两者显示具有高的1型错误(声明模型在统计上不同但实质上它们是相同的).如果比较两种分类算法或模型,McNemar的测试仍被认为是最好的.见Dietterich10.

或者作为替代方案,如果不是通过McNemar的测试,人们如何在实践中统计比较两种分类模型?