joe*_*org 4 python dataframe pandas
我有一个数据框,其中重复了一些 SongId。我想提取那些有重复的行。知道怎么做吗?尝试:
dfB[dfB.SongId.duplicated()]
Run Code Online (Sandbox Code Playgroud)
但效果并不好。
这是我的数据框的一个例子。SongId 0、10 和 16 在此示例中重复:
Moh*_* ah 12
尝试这个,
df=pd.DataFrame({"Song ID":[0,0,1,3,1,4,5],'ArtistID':[12,13,34,1,21,43,22]})
print df[df.duplicated(subset=['Song ID'],keep=False)]
Run Code Online (Sandbox Code Playgroud)
输出:
Song ID value
0 0 12
1 0 13
2 1 34
4 1 21
Run Code Online (Sandbox Code Playgroud)
| 归档时间: |
|
| 查看次数: |
9100 次 |
| 最近记录: |