小编Bro*_*ook的帖子

随机森林的特定交叉验证

使用随机森林与scikit学习.RF过度拟合数据并且预测结果很糟糕.

过度拟合不依赖于RF的参数:NBtree,Depth_Tree

过度匹配发生在许多不同的参数上(通过grid_search测试).

补救措施:我调整初始数据/下采样一些结果,以影响拟合(手动预处理噪声样本).

Loop on random generation of RF fits, 

Get RF prediction on the  data for prediction
Select the model which best fits the "predicted data" (not the calibration data).
Run Code Online (Sandbox Code Playgroud)

这个蒙特卡洛斯非常消耗,只是想知道是否有其他方法可以对随机森林进行交叉验证?(即不是超参数优化).

EDITED

scikit-learn

9
推荐指数
1
解决办法
2万
查看次数

标签 统计

scikit-learn ×1