小编Kar*_*lak的帖子

ScikitLearn中的Unconclusive RandomForest文档

在的集成方法文档Scikit-了解http://scikit-learn.org/stable/modules/ensemble.html#id6在第1.9.2.3.我们读到的参数:

(...)当min_samples_split = 1(即完全开发树木时)设置max_depth = None时,通常也会达到最佳效果.请记住,这些值通常不是最佳的.应始终交叉验证最佳参数值.

那么最佳结果和最佳结果之间有什么区别?我认为通过最佳结果,作者意味着最佳的交叉验证预测结果.

此外,请注意默认情况下,bootstrap样本在随机林中使用(bootstrap = True),而默认策略是使用原始数据集构建额外树(bootstrap = False).

我通过以下方式理解这一点:默认情况下,在Scikit-Learns实现中使用bootstrapping,但默认策略是使用bootstrapping.如果是这样,那么默认策略的来源是什么?为什么它不是实现中的默认策略?

python random-forest scikit-learn

5
推荐指数
1
解决办法
206
查看次数

标签 统计

python ×1

random-forest ×1

scikit-learn ×1