过滤仅显示重复项的数据框

Art*_*ito 3 r filter duplicates

我需要一些帮助来过滤数据框。

df 有几列,我想将其拆分为两个数据帧:

1- 仅包含第一列重复的行(包括所有副本)。

2- 其余行,不重复。

这是一个例子:这将是原始的。

          V1  V2 
    [1,] "A" "1"
    [2,] "B" "1"
    [3,] "A" "1"
    [4,] "C" "2"
    [5,] "D" "3"
    [6,] "D" "4"
Run Code Online (Sandbox Code Playgroud)

我想变成这样:

         V1  V2 
   [1,] "A" "1"
   [2,] "A" "1"
   [3,] "D" "3"
   [4,] "D" "4"
Run Code Online (Sandbox Code Playgroud)

和这个:

        V1  V2 
  [1,] "B" "1"
  [2,] "C" "2"
Run Code Online (Sandbox Code Playgroud)

有没有办法做到这一点?我曾尝试导出到 Excel,但数据集太大而无法实现。

谢谢

Ara*_*s7d 6

考虑df作为您的输入,您可以使用dplyr并尝试:

df %>% group_by(V1) %>% filter(n() > 1)
Run Code Online (Sandbox Code Playgroud)

对于重复项

df %>% group_by(V1) %>% filter(n() == 1)
Run Code Online (Sandbox Code Playgroud)

对于独特的条目。