是否有必要在预测之前对数据进行居中和缩放?

ama*_*hin 5 r r-caret

在插入符号包的训练函数中,可以执行预测变量的居中和缩放,如下例所示:

knnFit <- train(Direction ~ ., data = training, method = "knn",
                preProcess = c("center","scale"))
Run Code Online (Sandbox Code Playgroud)

在训练中设置此变换应该在重新采样期间更好地评估算法的性能.

在这种情况下,当我使用模型来预测新数据的响应时,我应该关心居中和缩放还是这个操作包含在最终模型中?

以下操作是否足够?

pred <- predict(knnFit, newdata = test)
Run Code Online (Sandbox Code Playgroud)

谢谢!

phi*_*ver 5

火车对象中指定的preProces将应用于新数据,而无需先对新数据进行预处理。这样您的操作就足够了。

还可以查看下面插入符号网站的摘录。还有一整节纯粹关于预处理。绝对值得您花时间阅读它。

您可以在此处找到插入符号网站

这些处理步骤将在使用predict.train,extractPrediction或extractProbs生成的任何预测期间应用(请参阅本文档后面的详细信息)。预处理将不适用于直接使用object $ finalModel对象的预测。