E.A*_*ari 5 classification machine-learning scikit-learn cross-validation
我的理解正确吗,以下代码中“ greed_search.fit(X,Y)”与嵌套的CV没有任何关系?这意味着无法使用sklearn中的嵌套CV获得最佳参数。
# inner cross_validation
greed_search = GridSearchCV(estimator=estimator, param_grid=parameters, cv=inner_cv, scoring=optimized_for)
greed_search.fit(X, optimization_label)
# Nested CV with parameter optimization
nested_score = cross_val_score(greed_search, X=X, y=Y, cv=outer_cv)
Run Code Online (Sandbox Code Playgroud)
你是对的:greed_search.fit(X, optimization_label)你的代码中的 是按原样执行的,而不嵌套到下一个交叉验证中。
为了回答你的第二个问题,我问你另一个问题:嵌套在交叉验证中的网格搜索的最佳参数应该是什么?第一个折叠的那些?最常见的?
内网格搜索在外交叉验证的每一步中,根据当前步骤的训练数据选择最佳参数。因此参数可以在折叠之间改变。自己进行外部交叉验证,您可以计算每个步骤的最佳参数,但我认为您并不真正需要它。