列出列值在数据框中不唯一的行

joe*_*org 4 python dataframe pandas

我有一个数据框,其中重复了一些 SongId。我想提取那些有重复的行。知道怎么做吗?尝试:

dfB[dfB.SongId.duplicated()]
Run Code Online (Sandbox Code Playgroud)

但效果并不好。

这是我的数据框的一个例子。SongId 0、10 和 16 在此示例中重复:

在此处输入图片说明

Moh*_* ah 12

尝试这个,

df=pd.DataFrame({"Song ID":[0,0,1,3,1,4,5],'ArtistID':[12,13,34,1,21,43,22]})
print df[df.duplicated(subset=['Song ID'],keep=False)]
Run Code Online (Sandbox Code Playgroud)

输出:

   Song ID  value
0        0     12
1        0     13
2        1     34
4        1     21
Run Code Online (Sandbox Code Playgroud)