我有一个pandas数据帧如下:
A B C
1 2 x
1 2 y
3 4 z
3 5 x
Run Code Online (Sandbox Code Playgroud)
我希望在特定列中只有一行共享相同值的行.在上面的例子中,我指的是A列和B列.换句话说,如果列A和B的值在数据帧中出现不止一次,则只应保留一行(哪一行无关紧要).
FWIW:所谓的重复行的最大数量(即,列A和B相同)是2.
结果应该像这样说:
A B C
1 2 x
3 4 z
3 5 x
Run Code Online (Sandbox Code Playgroud)
要么
A B C
1 2 y
3 4 z
3 5 x
Run Code Online (Sandbox Code Playgroud) 我有一个我想要更改的数据框(根据下面的代码),但它按字母顺序排列所有'实验'名称值.有没有办法在调用pandas.Dataframe.groupby之后保留订单?
df = df.groupby(['Experiment', 'Step'], as_index=False)['value'].aggregate(np.sum)
Run Code Online (Sandbox Code Playgroud)