我有这样的数据,其中一些"名称"出现超过3次:
df <- data.frame(name = c("a", "a", "a", "b", "b", "c", "c", "c", "c"), x = 1:9)
name x
1 a 1
2 a 2
3 a 3
4 b 4
5 b 5
6 c 6
7 c 7
8 c 8
9 c 9
Run Code Online (Sandbox Code Playgroud)
我希望根据"name"变量的每个级别内的行数(观察值)对数据进行子集化(过滤).如果某个级别的"名称"出现超过3次,我想删除属于该级别的所有行.
我写了这段代码,但无法让它工作.
name x
1 a 1
2 a 2
3 a 3
4 b 4
5 b 5
Run Code Online (Sandbox Code Playgroud) 我有一个数据框df,我试图将所有具有列值的行子集B在数据集中多次出现.
我尝试使用表来执行此操作,但是在从表中进行子集化时遇到了问题:
t<-table(df$B)
Run Code Online (Sandbox Code Playgroud)
然后我尝试使用以下方法对其进
subset(df, table(df$B)>1)
Run Code Online (Sandbox Code Playgroud)
我得到了错误
"x [subset&!is.na(subset)]中的错误:'closure'类型的对象不是子集"
如何使用表计数对数据框进行子集化?