为什么RandomForestClassifier中max_features的默认值与RandomForestRegressor中的默认值不同?

d13*_*337 6 scikit-learn

在is 和in RandomForestClassifier的默认值中,是否有任何具体原因?max_featuressqrt(n_features)RandomForestRegressorn_features

Gil*_*ppe 6

这是一种基于实证结果的启发式算法.平均而言,作为默认设置,似乎是更好的选择,为分类设置max_features = sqrt(n_features),为回归设置max_features = n_features.

这种启发式源于本文:http://orbi.ulg.ac.be/bitstream/2268/9357/1/geurts-mlj-advance.pdf

在任何情况下,交叉验证此参数当然总是更好的主意.

  • 是的,在这种情况下,所有树都是相同的(以寻找最佳分裂时可能发生的一些关系为模). (2认同)