过滤仅显示重复项的数据框

Question

我需要一些帮助来过滤数据框。

df 有几列，我想将其拆分为两个数据帧：

1- 仅包含第一列重复的行（包括所有副本）。

2- 其余行，不重复。

这是一个例子：这将是原始的。

          V1  V2 
    [1,] "A" "1"
    [2,] "B" "1"
    [3,] "A" "1"
    [4,] "C" "2"
    [5,] "D" "3"
    [6,] "D" "4"

我想变成这样：

         V1  V2 
   [1,] "A" "1"
   [2,] "A" "1"
   [3,] "D" "3"
   [4,] "D" "4"

和这个：

        V1  V2 
  [1,] "B" "1"
  [2,] "C" "2"

有没有办法做到这一点？我曾尝试导出到 Excel，但数据集太大而无法实现。

谢谢

Answer 1

考虑df作为您的输入，您可以使用dplyr并尝试：

df %>% group_by(V1) %>% filter(n() > 1)

对于重复项

和

df %>% group_by(V1) %>% filter(n() == 1)

对于独特的条目。