小编mrb*_*ean的帖子

如何在scikit-learn中保存随机森林？

实际上有很多关于持久性的问题,但我已经尝试了很多使用pickle或joblib.dumps.但当我用它来保存我的随机森林时我得到了这个:

ValueError: ("Buffer dtype mismatch, expected 'SIZE_t' but got 'long'", <type 'sklearn.tree._tree.ClassificationCriterion'>, (1, array([10])))

Run Code Online (Sandbox Code Playgroud)

谁能告诉我为什么？

一些代码供审查

forest = RandomForestClassifier()
forest.fit(data[:n_samples], target[:n_samples ])
import cPickle
with open('rf.pkl', 'wb') as f:
    cPickle.dump(forest, f)
with open('rf.pkl', 'rb') as f:
    forest = cPickle.load(f)

Run Code Online (Sandbox Code Playgroud)

要么

from sklearn.externals import joblib
joblib.dump(forest,'rf.pkl') 

from sklearn.externals import joblib
forest = joblib.load('rf.pkl')

Run Code Online (Sandbox Code Playgroud)

python random-forest scikit-learn

mrb*_*ean

2014 12-22

4
推荐指数

1
解决办法

3752
查看次数

无论如何要知道sklearn GridSearch的进展

对于网格搜索总是很耗时,所以我想看看它现在运行了多少.例如,它可能会输出

paramsXXX processed
paramsYYY processed
...

Run Code Online (Sandbox Code Playgroud)

python machine-learning scikit-learn data-science

mrb*_*ean

2016 05-23

2
推荐指数

1
解决办法

1410
查看次数

标签统计

python ×2

scikit-learn ×2

data-science ×1

machine-learning ×1

random-forest ×1

如何在scikit-learn中保存随机森林？

无论如何要知道sklearn GridSearch的进展

标签 统计

小编mrb_ean的帖子

标签统计