我喜欢这样的模特
groupedTrainingSet = group_by(trainingSet, geo);
models = do(groupedTrainingSet, mod = lm(revenue ~ julian, data=.))
grouptedTestSet = group_by(testSet, geo);
// TODO: apply model back to test set
Run Code Online (Sandbox Code Playgroud)
模特看起来像
geo mod
1 APAC <S3:lm>
2 LATAM <S3:lm>
3 ME <S3:lm>
7 ROW <S3:lm>
4 WE <S3:lm>
5 NA <S3:lm>
Run Code Online (Sandbox Code Playgroud)
我想我应该能够再次申请"做",但我没有看到它......或者我可以做一些事情.
apply(trainingData, fitted =
predict(select(models, geo==geo)$mod, .));
Run Code Online (Sandbox Code Playgroud)
但我不确定那里的语法.
这是一种dplyr获得类似答案的方法,遵循@ Mike.Gahan使用的方法:
library(dplyr)
iris.models <- iris %>%
group_by(Species) %>%
do(mod = lm(Sepal.Length ~ Sepal.Width, data = .))
iris %>%
tbl_df %>%
left_join(iris.models) %>%
rowwise %>%
mutate(Sepal.Length_pred = predict(mod,
newdata = list("Sepal.Width" = Sepal.Width)))
Run Code Online (Sandbox Code Playgroud)
或者,如果您创建预测函数,则可以一步完成:
m <- function(df) {
mod <- lm(Sepal.Length ~ Sepal.Width, data = df)
pred <- predict(mod,newdata = df["Sepal.Width"])
data.frame(df,pred)
}
iris %>%
group_by(Species) %>%
do(m(.))
Run Code Online (Sandbox Code Playgroud)