小编Osc*_*ria的帖子

使用 Pandas 数据框识别重复组

我有一个如下所述的数据框,我需要根据列 - c2、c3 和 c4 找出重复的组并相应地命名组。对于 C1 列中的任何值,如果行数相同并且所有行上的值集相同,则它是一个重复组,应使用相同的组名进行标记,否则,它是一个唯一组。

数据框:

df = pd.DataFrame({'C1': ['A', 'A', 'A', 'A', 'B', 'B', 'C', 'C', 'C', 'C', 'D', 'D', 'D'],
                   'C2': ['1', '2', '3', '4', '1', '2', '1', '2', '3', '4', '1', '2', '3'],
                   'C3': ['1', '2', '3', '4', '1', '2', '1', '2', '3', '4', '1', '2', '3'],
                   'C4': ['1', '2', '3', '4', '1', '2', '1', '2', '3', '4', '1', '2', '3']
                   })
Run Code Online (Sandbox Code Playgroud)

在此处输入图片说明

预期结果:

在此处输入图片说明

有什么帮助吗?

dataframe python-3.x pandas pandas-groupby

5
推荐指数
1
解决办法
1016
查看次数

标签 统计

dataframe ×1

pandas ×1

pandas-groupby ×1

python-3.x ×1