小编Yus*_*UMS的帖子

有没有更快的方法使用python从CSV中分离重复和不同的数据?

我有一个包含数百万数据的数据帧.假设这是名为的数据帧mydataframe:

filename | #insert-1 | #insert-2 | #delete-1 | #delete-2
---------------------------------------------------------
A        |         4 |         4 |         3 |         3
B        |         3 |         5 |         2 |         2
C        |         5 |         5 |         6 |         7
D        |         2 |         2 |         3 |         3
E        |         4 |         5 |         5 |         3
---------------------------------------------------------
Run Code Online (Sandbox Code Playgroud)

我需要根据插入或删除的不同数量来分离文件,然后将它们保存到新CSV文件中,命名为different.csv.并且还在CSV名为的单独文件中保存具有相同插入和删除数量的其余数据same.csv.在换句话说,如果该文件之间具有不同数目的#insert-1#insert-2,或#delete-1#delete-2然后将其保存在different.csv,否则,将其保存在same.csv. …

python csv duplicates dataframe pandas

4
推荐指数
1
解决办法
131
查看次数

标签 统计

csv ×1

dataframe ×1

duplicates ×1

pandas ×1

python ×1