R:按日期剪切,按ID和data.table分组

Question

R:按日期剪切,按ID和data.table分组

我有一个data.table带有一个演员列表的演员,这些演员通过id做事来做事date.actor特定事物的数量没有限制date.

require(data.table)
set.seed(28100)
df.in <- data.table(id = sample(1:10, 100, replace=TRUE),
                    date = sample(2001:2012, 100, replace=TRUE))

Run Code Online (Sandbox Code Playgroud)

现在,我想总结一下我的数据集,找出以下序列的每个区间的出现次数

sequence <- seq(2000, 2012, 4)

df.out1 <- as.data.frame(table(cut(df.in$date, breaks = sequence)))

df.out1
# Var1 Freq
# 1 (2000,2004]   35
# 2 (2004,2008]   27
# 3 (2008,2012]   38

Run Code Online (Sandbox Code Playgroud)

都好.但是现在我不计算事件的数量,而是计算每个区间中活动的参与者的数量,即一次或多次发生.

Answer 1

tal*_*lat 6

你的意思是这样的吗？

df.in[, interv := cut(date, sequence)][, .(Actors = length(unique(id))), by = interv]
#        interv Actors
#1: (2000,2004]     10
#2: (2008,2012]      9
#3: (2004,2008]     10

Run Code Online (Sandbox Code Playgroud)

如果您使用GitHub的开发版本1.9.5,您可以使用uniqueN()而不是length(unique()).

归档时间：	10 年，7 月前
查看次数：	1047 次
最近记录：	10 年，7 月前