如何一次比较四列pandas数据帧?

kit*_*kit 3 python indexing conditional-statements dataframe pandas

我有一个数据帧.

数据帧:

   Symbol1   BB Symbol2 CC 
0         ABC    1  ABC       1
1         PQR    1  PQR       1
2         CPC    2  CPC       0
3         CPC    2  CPC       1
4         CPC    2  CPC       2
Run Code Online (Sandbox Code Playgroud)

我想比较Symbol1Symbol2BB使用CC,如果他们是相同的话,我想那行唯一的其他行必须从数据帧中删除.

预期结果 :

Symbol1   BB Symbol2 CC 
0         ABC    1  ABC       1
1         PQR    1  PQR       1
2         CPC    2  CPC       2
Run Code Online (Sandbox Code Playgroud)

如果比较两行,那么我正在使用:

df = df[df['BB'] == '2'].copy()
Run Code Online (Sandbox Code Playgroud)

它会工作正常.

df = df[df['BB'] == df['offset'] and df['Symbol1'] == df['Symbol2']].copy()
Run Code Online (Sandbox Code Playgroud)

它给了我错误.

错误:

ValueError: The truth value of a Series is ambiguous. Use a.empty, a.bool(), a.item(), a.any() or a.all().
Run Code Online (Sandbox Code Playgroud)

我如何比较并得到预期的结果?

jez*_*ael 6

您可以使用boolean indexing与比较&,而不是and:

print ((df.Symbol1 == df.Symbol2) & (df.BB == df.CC))
0     True
1     True
2    False
3    False
4     True
dtype: bool

print (df[(df.Symbol1 == df.Symbol2) & (df.BB == df.CC)])
  Symbol1  BB Symbol2  CC
0     ABC   1     ABC   1
1     PQR   1     PQR   1
4     CPC   2     CPC   2
Run Code Online (Sandbox Code Playgroud)