熊猫,过滤其中包含另一列的行

wow*_*rch 5 python pandas

如何过滤包含另一列的行?例如,如果我们有两列A,B的DT,是否可以使用B.contains(A)过滤行?不仅B是否包含来自DT的所有A中的一些A值,而且还只是一行。

AB
大声笑
'ram''rambo'
'ki''pio'

结果:
AB
大声笑
'ram''rambo'

jez*_*ael 7

您可以使用boolean indexing由创建的掩码applyin如果需要过滤列AB每行:

#if necessary strip ' in all values
df = df.apply(lambda x: x.str.strip("'"))
#df = df.applymap(lambda x: x.strip("'"))

print (df.apply(lambda x: x.A in x.B, axis=1))
0     True
1     True
2    False
dtype: bool

df = df[df.apply(lambda x: x.A in x.B, axis=1)]
print (df)
     A      B
0  lol  lolec
1  ram  rambo
Run Code Online (Sandbox Code Playgroud)

解决方案的差异- 输入DataFrame更改:

print (df)
     A      B
0  lol    pio
1  ram  rambo
2   ki  lolec

print (df[df.apply(lambda x: x.A in x.B, axis=1)])
     A      B
1  ram  rambo

print (df[df['B'].str.contains("|".join(df['A']))])
    A      B
1  ram  rambo
2   ki  lolec
Run Code Online (Sandbox Code Playgroud)


Nic*_*eli 5

您可以str.contains通过使用正则表达式|字符来匹配每个子字符串,这意味着可以OR从其他系列的内容中进行选择:

df[df['B'].str.contains("|".join(df['A']))]
Run Code Online (Sandbox Code Playgroud)

在此处输入图片说明