帮助页面randomforest::randomforest()
说:
"classwt - 类的推荐.不需要加一个.忽略回归."
classwt
当您有大量不平衡数据时,可以设置参数帮助,即.班级的先辈们有很大的不同?
如何classwt
在具有3个类的数据集上训练模型时,如果先验矢量等于(p1,p2,p3),并且在测试集先验中是(q1,q2,q3)?
DrD*_*Dom 22
当你有大量不平衡的数据时,可以设置classwt参数帮助 - 类的先验强烈不同?
是的,设置classwt的值对于不平衡的数据集非常有用.我同意朱兰的观点,这些价值观可以用于抽样训练数据的概率(根据布莱曼在其原始文章中的论点).
如何在具有3个类的训练数据集中设置classwt,你的矢量先验等于(p1,p2,p3),并且在测试集先验中是(q1,q2,q3)?
对于培训,您可以简单地指定
rf <- randomForest(x=x, y=y, classwt=c(p1,p2,p3))
Run Code Online (Sandbox Code Playgroud)
对于测试集,不能使用先验:1)predict
randomForest包的方法中没有这样的选项; 2)权重仅对模型的训练有意义,而对预测没有意义.