我试图找到data.frames从广泛创建汇总表的懒惰/简单方法data.frames.假设有一个以下data.frame,但是有更多列,因此指定列名需要很长时间:
set.seed(2)
x <- data.frame(Rep = rep(1:3, 4), Temp = c(rep(10,6), rep(20,6)),
pH = rep(c(rep(8.1, 3), rep(7.6, 3)), 2),
Var1 = rnorm(12, 5,2), Var2 = c(rnorm(6,4,1), rnorm(6,3,5)),
Var3 = rt(12, 20))
x[1:3] <- as.data.frame(apply(x[1:3], 2, function(x) as.factor(x)))
Run Code Online (Sandbox Code Playgroud)
现在,我可以计算汇总统计信息plyr:
(mu <- ddply(x, .(Temp, pH), numcolwise(mean)))
(std <- ddply(x, .(Temp, pH), numcolwise(sd)))
(n <- ddply(x, .(Temp, pH), numcolwise(length)))
Run Code Online (Sandbox Code Playgroud)
但我无法弄清楚如何同时应用所有这些功能:
ddply(x, .(Temp, pH), numcolwise(mean, sd, length))
Run Code Online (Sandbox Code Playgroud)
我当然可以合并各种摘要data.tables,但这不是一种"懒惰/简单"的方式.我正在寻找一些我可以在许多情况下应用的一般内容.这样的事情,除了应该可以使用单个函数生成:
xx <- merge(mu, std, by = c("Temp", "pH"), sotr = …Run Code Online (Sandbox Code Playgroud)