小编mac*_*ner的帖子

可以在Spark MLlib随机森林培训中使用样品重量吗？

我使用Spark 1.5.0 MLlib Random Forest算法(scala代码)来做两类分类.由于我使用的数据集非常不平衡,因此大多数类以10%的采样率进行下采样.在Spark随机森林培训中是否可以使用采样权重(在这种情况下为10)？我没有看到trainClassifier()随机森林中输入参数的权重.我也在stackoverflow中进行了搜索,但在这个主题上找不到任何问题.非常感谢你的帮助!

scala random-forest apache-spark apache-spark-mllib

mac*_*ner

2019 05-21

6
推荐指数

1
解决办法

1460
查看次数