是否有必要在预测之前对数据进行居中和缩放？

Question

在插入符号包的训练函数中,可以执行预测变量的居中和缩放,如下例所示:

knnFit <- train(Direction ~ ., data = training, method = "knn",
                preProcess = c("center","scale"))

在训练中设置此变换应该在重新采样期间更好地评估算法的性能.

在这种情况下,当我使用模型来预测新数据的响应时,我应该关心居中和缩放还是这个操作包含在最终模型中？

以下操作是否足够？

pred <- predict(knnFit, newdata = test)

谢谢!

Answer 1

火车对象中指定的preProces将应用于新数据，而无需先对新数据进行预处理。这样您的操作就足够了。

还可以查看下面插入符号网站的摘录。还有一整节纯粹关于预处理。绝对值得您花时间阅读它。

您可以在此处找到插入符号网站。

这些处理步骤将在使用predict.train，extractPrediction或extractProbs生成的任何预测期间应用（请参阅本文档后面的详细信息）。预处理将不适用于直接使用object $ finalModel对象的预测。