shi*_*shu 2 python pipeline scikit-learn grid-search
我将 GridSearchCV 与管道一起使用,如下所示:
grid = GridSearchCV(
Pipeline([
('reduce_dim', PCA()),
('classify', RandomForestClassifier(n_jobs = -1))
]),
param_grid=[
{
'reduce_dim__n_components': range(0.7,0.9,0.1),
'classify__n_estimators': range(10,50,5),
'classify__max_features': ['auto', 0.2],
'classify__min_samples_leaf': [40,50,60],
'classify__criterion': ['gini', 'entropy']
}
],
cv=5, scoring='f1')
grid.fit(X,y)
Run Code Online (Sandbox Code Playgroud)
我现在如何从模型中检索 PCA 详细信息(例如components和 )?explained_variancegrid.best_estimator_
此外,我还想best_estimator_使用 pickle 将其保存到文件中,然后加载它。如何从此加载的估算器中检索 PCA 详细信息?我怀疑它会和上面一样。
grid.best_estimator_就是以最佳参数接入管道。
现在使用named_steps[]属性来访问管道的内部估计器。
所以grid.best_estimator_.named_steps['reduce_dim']会给你这个pca对象。现在您可以简单地使用它来访问此 pca 对象的components_和explained_variance_属性,如下所示:
grid.best_estimator_.named_steps['reduce_dim'].components_
grid.best_estimator_.named_steps['reduce_dim'].explained_variance_