Art*_*ito 3 r filter duplicates
我需要一些帮助来过滤数据框。
df 有几列,我想将其拆分为两个数据帧:
1- 仅包含第一列重复的行(包括所有副本)。
2- 其余行,不重复。
这是一个例子:这将是原始的。
V1 V2
[1,] "A" "1"
[2,] "B" "1"
[3,] "A" "1"
[4,] "C" "2"
[5,] "D" "3"
[6,] "D" "4"
Run Code Online (Sandbox Code Playgroud)
我想变成这样:
V1 V2
[1,] "A" "1"
[2,] "A" "1"
[3,] "D" "3"
[4,] "D" "4"
Run Code Online (Sandbox Code Playgroud)
和这个:
V1 V2
[1,] "B" "1"
[2,] "C" "2"
Run Code Online (Sandbox Code Playgroud)
有没有办法做到这一点?我曾尝试导出到 Excel,但数据集太大而无法实现。
谢谢
考虑df作为您的输入,您可以使用dplyr并尝试:
df %>% group_by(V1) %>% filter(n() > 1)
Run Code Online (Sandbox Code Playgroud)
对于重复项
和
df %>% group_by(V1) %>% filter(n() == 1)
Run Code Online (Sandbox Code Playgroud)
对于独特的条目。