假设我有一个如下数据框,
ID <- c("A","A","A","B","B","B","C","C")
Type <- c(45,46,47,45,46,47,45,46)
Point_A <- c(10,15,20,8,9,10,35,33)
df <- data.frame(ID,Type,Point_A)
Run Code Online (Sandbox Code Playgroud)
我正在对此数据框使用dplyr groupby函数,
library(dplyr)
df %>% group_by(ID) %>% summarise(q=n())
Run Code Online (Sandbox Code Playgroud)
以下是我得到的输出,
ID q
(fctr) (int)
1 A 3
2 B 3
3 C 2
Run Code Online (Sandbox Code Playgroud)
现在,我要过滤计数为2的行。理想情况下,代码应删除计数为2的行。代码的输出应为:
ID Type Point_A
1 A 45 10
2 A 46 15
3 A 47 20
4 B 45 8
5 B 46 9
6 B 47 10
Run Code Online (Sandbox Code Playgroud)
因为计数为2的行已被删除。
是否有可能做到这一点?有人可以帮我吗?
谢谢
您可以一起使用n()和filter(),而无需summarize():
df %>%
group_by(ID) %>%
filter(n() != 2)
# Source: local data frame [6 x 3]
# Groups: ID [2]
#
# ID Type Point_A
# (fctr) (dbl) (dbl)
# 1 A 45 10
# 2 A 46 15
# 3 A 47 20
# 4 B 45 8
# 5 B 46 9
# 6 B 47 10
Run Code Online (Sandbox Code Playgroud)