从熊猫中删除非重复行

Question

这相当简单，但我无法理解。假设对于以下数据框，我只想保留 y 列中具有重复值的行：

所需的输出如下所示：

我试过这个：

df[~df.duplicated('y')]

但我明白了：

Answer 1

保持：{'first', 'last', False}，默认为'first'

first ：除第一次出现外，将重复项标记为 True。

last : 除最后一次出现外，将重复项标记为 True。

False ：将所有重复项标记为 True。

这意味着您正在寻找：

df[df.duplicated('y',keep=False)]

输出：