jov*_*cbg 2 python dataframe pandas
我有一个大约50万行的数据框。如我所见,有很多重复的行,那么如何删除所有列(大约80列)中具有相同值的重复行,而不仅仅是一个?
df:
period_start_time id val1 val2 val3
06.13.2017 22:00:00 i53 32 2 10
06.13.2017 22:00:00 i32 32 2 10
06.13.2017 22:00:00 i32 4 2 8
06.13.2017 22:00:00 i32 4 2 8
06.13.2017 22:00:00 i32 4 2 8
06.13.2017 22:00:00 i20 7 7 22
06.13.2017 22:00:00 i20 7 7 22
Run Code Online (Sandbox Code Playgroud)
所需的输出:
period_start_time id val1 val2 val3
06.13.2017 22:00:00 i53 32 2 10
06.13.2017 22:00:00 i32 32 2 10
06.13.2017 22:00:00 i32 4 2 8
06.13.2017 22:00:00 i20 7 7 22
Run Code Online (Sandbox Code Playgroud)
df = df.drop_duplicates()
print (df)
period_start_time id val1 val2 val3
0 06.13.2017 22:00:00 i53 32 2 10
1 06.13.2017 22:00:00 i32 32 2 10
2 06.13.2017 22:00:00 i32 4 2 8
5 06.13.2017 22:00:00 i20 7 7 22
Run Code Online (Sandbox Code Playgroud)
| 归档时间: |
|
| 查看次数: |
5102 次 |
| 最近记录: |