相关疑难解决方法(0)

从Pandas数据框中删除重复的行,其中只有一些列具有相同的值

我有一个pandas数据帧如下:

A   B   C
1   2   x
1   2   y
3   4   z
3   5   x
Run Code Online (Sandbox Code Playgroud)

我希望在特定列中只有一行共享相同值的行.在上面的例子中,我指的是A列和B列.换句话说,如果列AB的值在数据帧中出现不止一次,则只应保留一行(哪一行无关紧要).

FWIW:所谓的重复行的最大数量(即,列AB相同)是2.

结果应该像这样说:

A   B   C
1   2   x
3   4   z
3   5   x
Run Code Online (Sandbox Code Playgroud)

要么

A   B   C
1   2   y
3   4   z
3   5   x
Run Code Online (Sandbox Code Playgroud)

python duplicates dataframe pandas

8
推荐指数
1
解决办法
2万
查看次数

使用pandas.Dataframe.groupby没有字母顺序

我有一个我想要更改的数据框(根据下面的代码),但它按字母顺序排列所有'实验'名称值.有没有办法在调用pandas.Dataframe.groupby之后保留订单?

df = df.groupby(['Experiment', 'Step'], as_index=False)['value'].aggregate(np.sum)
Run Code Online (Sandbox Code Playgroud)

python group-by dataframe pandas alphabetical-sort

6
推荐指数
1
解决办法
3415
查看次数