如何为包含特定项目的列表筛选DataFrame列

rur*_*urp 5 python python-2.7 pandas

如果我想为那些包含特定术语的字符串过滤一列字符串,我可以这样做:

df = pd.DataFrame({'col':['ab','ac','abc']})
df[df['col'].str.contains('b')]
Run Code Online (Sandbox Code Playgroud)

收益:

   col
0   ab
2  abc
Run Code Online (Sandbox Code Playgroud)

如何为包含特定项目的列表筛选列表?例如,来自

df = pd.DataFrame({'col':[['a','b'],['a','c'],['a','b','c']]})
Run Code Online (Sandbox Code Playgroud)

如何获得包含'b'的所有列表?

         col
0     [a, b]
2  [a, b, c]
Run Code Online (Sandbox Code Playgroud)

chr*_*isb 11

您可以像这样使用apply.

In [13]: df[df['col'].apply(lambda x: 'b' in x)]
Out[13]: 
         col
0     [a, b]
2  [a, b, c]
Run Code Online (Sandbox Code Playgroud)

虽然通常情况下,将列表存储在a DataFrame中有点尴尬 - 您可能会发现一些更容易使用的不同表示(列表中的每个元素的列,MultiIndex等).