计算列的重复数

Amo*_*Ong 5 r

我的目标是计算列中有多少重复项。
所以我有一列 3516 obs。对于 1 个变量,
所有日期都有大约 144 个重复,每个日期从 1/4/16 到 7/3/16。
示例:(我放了 1 个副本作为示例)
1/4/16
1/4/16
31/3/16
31/3/16
30/3/16
30/3/16
29/3/16
29/3 /16
28/3/16
28/3/16
所以我使用了函数 date = count(date)
其中 date 是我的 df 日期。
但是一旦我执行它,我的日期序列就不再有序了。
希望有人能解决我的问题。

Ron*_*hah 7

如果您想要列中重复次数的计数,您可以使用 duplicated

sum(duplicated(df$V1))
#[1] 5
Run Code Online (Sandbox Code Playgroud)

假设V1为您的列名。

编辑

根据更新,如果您想要每个数据的计数,您可以使用该table功能,该功能将为您提供准确的信息

table(df$V1)

#1/4/16 28/3/16 29/3/16 30/3/16 31/3/16 
#  2       2       2       2       2 
Run Code Online (Sandbox Code Playgroud)


akr*_*run 6

如果我们需要计算重复的总数

sum(table(df1$date)-1)
#[1] 5
Run Code Online (Sandbox Code Playgroud)

假设,我们需要每个日期的计数,一种选择是按“日期”分组并获取行数。这可以通过data.table.

library(data.table)
setDT(df1)[, .N, date]
Run Code Online (Sandbox Code Playgroud)