vei*_*ich 4 python random-forest scikit-learn
我每秒只能用这个模型进行 2-3 次预测,速度非常慢。使用LinearRegression模型时,我可以轻松实现 40 倍的加速。
我正在使用scikit-learnpython 包和一个非常简单的数据集,其中包含 3 列(day、hour和result),所以基本上有 2 个功能。
day和hour是分类变量。
自然有7类day和24hour类。
训练样本相对较小(cca 5000 个样本)。
训练它只需要一露秒。
但当我继续预测某事时,速度就非常慢。
所以我的问题是:这是基本特征吗?RandomForrestRegressor或者我实际上可以对此做些什么?
from sklearn.ensemble import RandomForestRegressor
model = RandomForestRegressor(n_estimators=100,
max_features='auto',
oob_score=True,
n_jobs=-1,
random_state=42,
min_samples_leaf=2)
Run Code Online (Sandbox Code Playgroud)
以下是使用 sklearn 优化随机森林的一些步骤
predict()。这减少了 Python 开销。min_samples_leaf或 的东西min_samples_split来避免有很多小的决策节点。要使用训练集的 5%,请使用0.05。n_estimators=10.必须使用交叉验证或类似方法来验证优化模型的性能。步骤 2 和步骤 3 是相关的,因此可以进行网格搜索来找到最能保持模型性能的组合。
| 归档时间: |
|
| 查看次数: |
6217 次 |
| 最近记录: |