小编LuL*_*U W的帖子

在 Sklearn PIpeline 和交叉验证中使用缩放器

之前看过一个帖子,代码是这样的:

scalar = StandardScaler()
clf = svm.LinearSVC()

pipeline = Pipeline([('transformer', scalar), ('estimator', clf)])

cv = KFold(n_splits=4)
scores = cross_val_score(pipeline, X, y, cv = cv)
Run Code Online (Sandbox Code Playgroud)

我的理解是:当我们应用缩放,我们应该使用3出4倍来计算平均值和标准差,那么我们应用均值和标准差的所有4倍。

在上面的代码中,我怎么知道 Sklearn 遵循相同的策略?另一方面,如果 sklearn 不遵循相同的策略,这意味着 sklearn 将计算所有 4 折的均值/标准差。这是否意味着我不应该使用上述代码?

我喜欢上面的代码,因为它节省了大量的时间。

python pipeline scikit-learn cross-validation

1
推荐指数
1
解决办法
3555
查看次数

标签 统计

cross-validation ×1

pipeline ×1

python ×1

scikit-learn ×1