McNemar在Python中的测试和分类机器学习模型的比较

Yo *_*iao 10 python statistics classification machine-learning text-classification

是否有一个很好的McNemar测试在Python中实现？我没有在Scipy.stats或Scikit-Learn中看到它.我可能忽略了其他一些好的套餐.请推荐.

McNemar的测试几乎是用于比较给定保持测试集的两种分类算法/模型的测试(不是通过K折叠或重采样方法来模拟测试集).两种常见的替代方案是:用于比较直接真实正比例p_A和p_B来自两种算法和模型的t检验,A以及B1)假设方差遵循二项分布或2)使用重复重采样序列和测试集来估计方差.

然而,后两者显示具有高的1型错误(声明模型在统计上不同但实质上它们是相同的).如果比较两种分类算法或模型,McNemar的测试仍被认为是最好的.见Dietterich10.

或者作为替代方案,如果不是通过McNemar的测试,人们如何在实践中统计比较两种分类模型？

归档时间：	9 年，1 月前
查看次数：	2482 次
最近记录：	9 年，1 月前

Matrix中的矩阵转置 134

为什么运行Flask开发服务器会自行运行两次？ 81

Python:在运行时更改方法和属性 72

有没有办法否定返回变量的布尔值？ 70

使列表尽可能不排序的函数 59

使用Python读取YAML文件导致yaml.composer.ComposerError:期望流中的单个文档 57

将表名作为参数传递给psycopg2 48

"setup.py upload"失败,显示"上传失败(401):您必须识别出编辑包信息" 46

如何在Python中计算cohen的d？ 11

如何重新分区pyspark数据帧？ 9

如何有效地配对袜子？ 3850

你如何获得JavaScript的时间戳？ 3844

家谱软件中的循环 1594

Dockerfile中CMD和ENTRYPOINT有什么区别？ 1484

如何删除导出的环境变量？ 1439

什么是C++ 11中的lambda表达式？ 1408

如何在git历史中grep(搜索)已提交的代码？ 1342

在HTML中显示哪些字符可用于上/下三角(没有词干的箭头)？ 1212

在jQuery中序列化为JSON 1189

为什么使用'=='或'is'比较字符串有时会产生不同的结果？ 1076