我知道这可以通过其他软件包实现,但我正在努力data.table(因为它似乎是分组最快).
library(data.table)
dt = data.table(a=c(1,2,2,3))
dt[,length(a),by=a]
Run Code Online (Sandbox Code Playgroud)
结果是
a V1
1: 1 1
2: 2 1
3: 3 1
Run Code Online (Sandbox Code Playgroud)
而
df = data.frame(a=c(1,2,2,3))
ddply(df,.(a),summarise,V1=length(a))
Run Code Online (Sandbox Code Playgroud)
产生
a V1
1 1 1
2 2 2
3 3 1
Run Code Online (Sandbox Code Playgroud)
这是一个更明智的结果.只是想知道为什么data.table不给出相同的结果,以及如何实现这一目标.