小编LuL*_*U W的帖子

在 Sklearn PIpeline 和交叉验证中使用缩放器

之前看过一个帖子，代码是这样的：

scalar = StandardScaler()
clf = svm.LinearSVC()

pipeline = Pipeline([('transformer', scalar), ('estimator', clf)])

cv = KFold(n_splits=4)
scores = cross_val_score(pipeline, X, y, cv = cv)

Run Code Online (Sandbox Code Playgroud)

我的理解是：当我们应用缩放，我们应该使用3出4倍来计算平均值和标准差，那么我们应用均值和标准差的所有4倍。

在上面的代码中，我怎么知道 Sklearn 遵循相同的策略？另一方面，如果 sklearn 不遵循相同的策略，这意味着 sklearn 将计算所有 4 折的均值/标准差。这是否意味着我不应该使用上述代码？

我喜欢上面的代码，因为它节省了大量的时间。

python pipeline scikit-learn cross-validation

LuL*_*U W

lucky-day

1
推荐指数

1
解决办法

3555
查看次数

标签统计

cross-validation ×1

pipeline ×1

python ×1

scikit-learn ×1

在 Sklearn PIpeline 和交叉验证中使用缩放器

标签 统计

小编LuL_U W的帖子

标签统计