weka是否在交叉验证中跨类别平衡列车/测试集?

gop*_*uri 0 machine-learning weka cross-validation

当我对m类进行n次交叉验证时,在每个折叠中,列车和测试装置是否平衡?通过平衡,我的意思是询问在列车和测试集中是否存在(几乎)来自每个类的相同样本集.

Ste*_*joa 5

如果我正确理解这部分:

我的意思是询问列车和测试集中是否有(几乎)相同的样本集.

...我认为你指的是分层交叉验证:每个折叠的类比例与整个数据集的类比例相同.

是的,在Weka中肯定是可能的,但您可能需要查阅文档.这些帮助可能吗?

http://weka.wikispaces.com/Primer

http://weka.wikispaces.com/Generating+cross-validation+folds+(Java+approach)

http://weka.sourceforge.net/doc/weka/filters/supervised/instance/StratifiedRemoveFolds.html

  • Weka默认使用GUI(Weka Explorer)时会进行分层交叉验证.这可以通过查看*Classifier输出*文本并查看短语`===分层交叉验证===`来验证.希望这可以帮助. (2认同)