我有一个如下所述的数据框,我需要根据列 - c2、c3 和 c4 找出重复的组并相应地命名组。对于 C1 列中的任何值,如果行数相同并且所有行上的值集相同,则它是一个重复组,应使用相同的组名进行标记,否则,它是一个唯一组。
数据框:
df = pd.DataFrame({'C1': ['A', 'A', 'A', 'A', 'B', 'B', 'C', 'C', 'C', 'C', 'D', 'D', 'D'],
'C2': ['1', '2', '3', '4', '1', '2', '1', '2', '3', '4', '1', '2', '3'],
'C3': ['1', '2', '3', '4', '1', '2', '1', '2', '3', '4', '1', '2', '3'],
'C4': ['1', '2', '3', '4', '1', '2', '1', '2', '3', '4', '1', '2', '3']
})
Run Code Online (Sandbox Code Playgroud)
预期结果:
有什么帮助吗?