我使用Spark 1.5.0 MLlib Random Forest算法(scala代码)来做两类分类.由于我使用的数据集非常不平衡,因此大多数类以10%的采样率进行下采样.在Spark随机森林培训中是否可以使用采样权重(在这种情况下为10)?我没有看到trainClassifier()随机森林中输入参数的权重.我也在stackoverflow中进行了搜索,但在这个主题上找不到任何问题.非常感谢你的帮助!
如何访问Spark ML的RandomForestClassifier生成的模型中的单个树?我正在使用Scala版本的RandomForestClassifier.