R中RandomForest包中的RandomForest函数中的参数'classwt'代表什么?

Qbi*_*bik 20 r random-forest

帮助页面randomforest::randomforest()说:

"classwt - 类的推荐.不需要加一个.忽略回归."

classwt当您有大量不平衡数据时,可以设置参数帮助,即.班级的先辈们有很大的不同?

如何classwt在具有3个类的数据集上训练模型时,如果先验矢量等于(p1,p2,p3),并且在测试集先验中是(q1,q2,q3)?

DrD*_*Dom 22

当你有大量不平衡的数据时,可以设置classwt参数帮助 - 类的先验强烈不同?

是的,设置classwt的值对于不平衡的数据集非常有用.我同意朱兰的观点,这些价值观可以用于抽样训练数据的概率(根据布莱曼在其原始文章中的论点).

如何在具有3个类的训练数据集中设置classwt,你的矢量先验等于(p1,p2,p3),并且在测试集先验中是(q1,q2,q3)?

对于培训,您可以简单地指定

rf <- randomForest(x=x, y=y, classwt=c(p1,p2,p3))
Run Code Online (Sandbox Code Playgroud)

对于测试集,不能使用先验:1)predictrandomForest包的方法中没有这样的选项; 2)权重仅对模型的训练有意义,而对预测没有意义.