我正在寻找一种简短有效的方法来对因子的每个级别运行单独的方差分析。我认为,我目前拥有的东西是多余的,而且会弄乱工作空间。假设我有以下内容:
Letter Number Question
A 1 1
A 2 1
A 3 1
B 1 1
B 2 1
B 3 1
C 1 1
C 2 1
C 3 1
Run Code Online (Sandbox Code Playgroud)
我可以运行以下代码将数据帧拆分为子集 A、B 和 C:
> list2env(split(data, data$Letter), globalenv())
> ANOVA.A <- aov(Question~Number, data=A)
> ANOVA.B <- aov(Question~Number, data=B)
> ANOVA.C <- aov(Question~Number, data=C)
Run Code Online (Sandbox Code Playgroud)
虽然这为我提供了所需的结果,但它使工作区变得混乱。我的实际数据集要大得多,所以我正在寻找更简单、更优雅的东西。
使用基础lapply:
lapply(split(df, df$Letter), aov, formula=Question ~ Number)
Run Code Online (Sandbox Code Playgroud)
或者使用dplyr:
library(dplyr)
obj <- df %>% group_by(Letter) %>% do(model = aov(Question~Number, data = .))
obj$model
Run Code Online (Sandbox Code Playgroud)
使用data.table:
library(data.table)
df <- as.data.table(df)
df[, list(Model = list(aov(Question ~ Number))), keyby = Letter]$Model
Run Code Online (Sandbox Code Playgroud)