小编Pur*_*mon的帖子

从上到下删除两个未分组列中的重复项

这是一个示例数据框,用于显示我的问题和我想要实现的目标。这里我有两列xy,我想从中删除重复项。我还有z包含行的排序排名的列。

  x   y   z
1 A   BB  8
2 B   BB  7.5
3 B   AA  6.2
4 B   CC  5
5 C   DD  4
6 D   CC  3
Run Code Online (Sandbox Code Playgroud)

我试图同时查看两者,每次两列中都有重复项时,然后删除该行并继续xy

我正在寻找的最终结果是

  x   y   z
1 A   BB  8
3 B   AA  6.2
5 C   DD  4
6 D   CC  3
Run Code Online (Sandbox Code Playgroud)

BB列中的第二个y被删除。然后,该B - AA行不会被删除,因为逐行向下,它现在是列B中的第一行x。这是针对大型数据集的,因此不幸的是我无法手动完成。

我并不是想将这两列组合在一起。我也不想一次删除一列的重复项,因为如果这样做的话,就会删除太多的观察结果。

如何才能实现这一目标?

r duplicates dataframe dplyr

13
推荐指数
2
解决办法
544
查看次数

标签 统计

dataframe ×1

dplyr ×1

duplicates ×1

r ×1