Scikit的ExtraTreeRegressor考虑的特征学习构建随机森林

Yas*_*ash 1 python machine-learning random-forest scikit-learn

我遇到了这个涉及测试数据集完成面的示例.这里,32for 的值max_features传递给ExtraTreesRegressor()函数.我了解到构造了决策树,它从输入数据集中选择随机特征.对于上述链接的示例,图像用作训练和测试数据集.此Wiki页面描述了各种类型的图像功能.现在,我无法理解剂量sklearn.ensemble.ExtraTreeRegressor寻找的哪些特征或从作为输入提供的图像数据集中提取以构建随机森林.此外,如何确定值32是最佳的max_features.请帮我解决一下这个.

Fre*_*Foo 6

随机森林不进行特征提取.他们使用给定数据集中的特征,在这个例子中,这些特征只是来自Olivetti人脸数据集的像素强度.

a的max_features参数ExtraTreesRegressor确定"寻找最佳分割时要考虑的特征数量"(在森林采用的决策树学习算法内).

值32可能是凭经验确定的.


And*_*ler 6

这里使用的功能是原始像素值.由于数据集中的图像是对齐且非常相似的,因此对于任务而言似乎已足够.