这是一个示例数据框,用于显示我的问题和我想要实现的目标。这里我有两列x和y,我想从中删除重复项。我还有z包含行的排序排名的列。
x y z
1 A BB 8
2 B BB 7.5
3 B AA 6.2
4 B CC 5
5 C DD 4
6 D CC 3
Run Code Online (Sandbox Code Playgroud)
我试图同时查看两者,每次两列中都有重复项时,然后删除该行并继续x。y
我正在寻找的最终结果是
x y z
1 A BB 8
3 B AA 6.2
5 C DD 4
6 D CC 3
Run Code Online (Sandbox Code Playgroud)
BB列中的第二个y被删除。然后,该B - AA行不会被删除,因为逐行向下,它现在是列B中的第一行x。这是针对大型数据集的,因此不幸的是我无法手动完成。
我并不是想将这两列组合在一起。我也不想一次删除一列的重复项,因为如果这样做的话,就会删除太多的观察结果。
如何才能实现这一目标?