基于列值的行总和

Question

基于列值的行总和

我想在一列中对具有相同值的行求和:

> df <- data.frame("1"=c("a","b","a","c","c"), "2"=c(1,5,3,6,2), "3"=c(3,3,4,5,2))
> df
  X1 X2 X3
1  a  1  3
2  b  5  3
3  a  3  4
4  c  6  5
5  c  2  2

Run Code Online (Sandbox Code Playgroud)

对于一列(X2),可以聚合数据以获得具有相同X1值的所有行的总和:

> ddply(df, .(X1), summarise, X2=sum(X2))
  X1 X2
1  a  4
2  b  5
3  c  8

Run Code Online (Sandbox Code Playgroud)

如何为X3和除X1之外的任意数量的其他列执行相同的操作？

这是我想要的结果:

Run Code Online (Sandbox Code Playgroud)

Answer 1

Ist*_*sta 27

ddply(df, "X1", numcolwise(sum))

Run Code Online (Sandbox Code Playgroud)

请参阅?numcolwise详细信息和示例.

Answer 2

Mat*_*erg 22

aggregate 可以使用公式界面轻松完成此操作:

aggregate(. ~ X1, data=df, FUN=sum)
##   X1 X2 X3
## 1  a  4  7
## 2  b  5  3
## 3  c  8  7

Run Code Online (Sandbox Code Playgroud)

等价的:

aggregate(cbind(X2, X3) ~ X1, data=df, FUN=sum)

Run Code Online (Sandbox Code Playgroud)

Answer 3

the*_*ail 6

aggregate 对于这些事情来说,它是一个很好的功能:

aggregate(df[,-1],df["X1"],sum)

  X1 X2 X3
1  a  4  7
2  b  5  3
3  c  8  7

Run Code Online (Sandbox Code Playgroud)

并且numcolwise来自plyr 的方法的基本R版本:

aggregate(df[,sapply(df,is.numeric)],df["X1"],sum)

Run Code Online (Sandbox Code Playgroud)

Answer 4

mne*_*nel 5

甲data.table用于存储器效率和编码优雅溶液

library(data.table)
DT <- data.table(df)


DT[, lapply(.SD, sum), by = X1]

Run Code Online (Sandbox Code Playgroud)

.SD是由值定义的每个组的data.table的子集X1.这个data.table包有3个有用的插图.

归档时间：	12 年，12 月前
查看次数：	43853 次
最近记录：	12 年，12 月前