我有以下数据框:
df=pd.DataFrame([[1,11,'a'],[2,12,'b'],[1,11,'c'],[3,12,'d'],[3,7,'e'],
[2,12,'f']])
df.columns=['id','code','name']
print(df)
id code name
0 1 11 a
1 2 12 b
2 1 11 c
3 3 12 d
4 3 7 e
5 2 12 f
Run Code Online (Sandbox Code Playgroud)
对于上面的数据帧,我想只有列'name'的一个值,用于任何唯一的column id和code.对于eq,name行0和2应该相同.而且,name行1和5也应该相同.
id code name
0 1 11 a
1 2 12 b
2 1 11 a
3 3 12 d
4 3 7 e
5 2 12 b
Run Code Online (Sandbox Code Playgroud)
请让我知道如何以编程方式完成此操作.我有两个超过100000行进行此操作.
谢谢
我有以下数据框:
import pandas as pd
df=pd.DataFrame([[1,11,'a'],[1,12,'a'],[1,11,'a'],[1,12,'a'],[1,7,'a'],
[1,12,'a']])
df.columns=['id','code','name']
df
id code name
0 1 11 a
1 1 12 a
2 1 11 a
3 1 12 a
4 1 7 a
5 1 12 a
Run Code Online (Sandbox Code Playgroud)
如以上数据框所示,列“ id”的值与列“ name”的值直接相关。如果说一百万条记录,我怎么知道一列完全依赖于数据框中的另一列?