如何比较 DataFrame 的 3 列,Python 3.6

SPy*_*SPy 4 python list dataframe python-3.x pandas

我有下面的数据框,我想比较 3 列值并更新另一列“Id_Name_Table_Matching”中的 True/False

下面是我的代码:

L1_ID = ['Region', 'Col2', 'Col3', 'Col4', 'Col5']
L1_Name = ['Region', 'Col2', 'Col3', 'Col4', 'Col5']
L1_Table = ['Region', 'Col2', 'Col3', 'Col4', 'Col5']

DF1 = pd.DataFrame({'dimId': L1_ID, 'dimName': L1_Name, 'sqlTableColumn': L1_Table})
Run Code Online (Sandbox Code Playgroud)

如果所有列值匹配,我想在“Id_Name_Table_Matching”中更新 true,否则为 false。我需要如下脚本:

DF1['Id_Name_Table_Matching'] = DF1['dimId'] == DF1['dimName'] == DF1['sqlTableColumn']
Run Code Online (Sandbox Code Playgroud)

jez*_*ael 5

将第一列与第二列进行比较,然后与最后一个列和链式布尔值掩码进行&按位比较AND

DF1['Id_Name_Table_Matching'] = (DF1['dimId'] == DF1['dimName']) & 
                                (DF1['dimId'] == DF1['sqlTableColumn'])
Run Code Online (Sandbox Code Playgroud)

比较列表中定义的多个列的一般解决方案 - 所有过滤列都按第一个 by 进行比较DataFrame.eq,然后检查每行的所有值是否都是Trues by DataFrame.all

cols = ['dimId','dimName','sqlTableColumn']
DF1['Id_Name_Table_Matching'] = DF1[cols].eq(DF1[cols[0]], axis=0).all(axis=1)
print (DF1)
    dimId dimName sqlTableColumn  Id_Name_Table_Matching
0  Region  Region         Region                    True
1    Col2    Col2           Col2                    True
2    Col3    Col3           Col3                    True
3    Col4    Col4           Col4                    True
4    Col5    Col5           Col5                    True
Run Code Online (Sandbox Code Playgroud)

细节

print (DF1[cols].eq(DF1[cols[0]], axis=0))
   dimId  dimName  sqlTableColumn
0   True     True            True
1   True     True            True
2   True     True            True
3   True     True            True
4   True     True            True
Run Code Online (Sandbox Code Playgroud)