DaT*_*omB 8 machine-learning weka supervised-learning
我有一个带有一些名义值的数据集作为特征.我所拥有的训练集有一组标称特征的值,这些值在我的测试集中是不存在的.例如,我在训练集中的特征对应于
@attribute h4 {br,pl,com,ro,th,np}
和测试集中的相同功能有
@attribute h4 {br,pl,abc,th,def,ghi,lmno}
我相信因此,weka不允许我重新评估我在我的测试集上的训练集上建立的模型.有没有解决的办法?我错过了什么吗?
编辑:我正在使用RandomForest分类器.
谢谢
Weka寻求测试集中使用的所有标称值也都存在于训练集中,因为分类器应该在进行预测之前学习。
此外,Weka还使用标称值及其指数。因此,重要的是对相同属性的名义值使用相同的顺序以获得可靠的结果。
在您的情况下,只需对训练集和测试集以相同的顺序使用相同的值(涵盖所有值)即可。
您的组合值{br,pl,com,ro,th,np,abc,th,def,ghi,lmno}可用于训练集和测试集。