熊猫行选择字符串以列表中任何项目开头的位置

Han*_*han 4 pandas

我想根据特定的字符串列在 Pandas 数据框中选择行的子集,其中值以列表中任意数量的值开头。

这个的一个小版本:

df = pd.DataFrame({'a': ['aa10', 'aa11', 'bb13', 'cc14']})
valids = ['aa', 'bb']
Run Code Online (Sandbox Code Playgroud)

所以我只想要那些aaabb在这种情况下开头的行。

WeN*_*Ben 6

你需要 startswith

df.a.str.startswith(tuple(valids))
Out[191]: 
0     True
1     True
2     True
3    False
Name: a, dtype: bool
Run Code Online (Sandbox Code Playgroud)

用原始 df 过滤后

df[df.a.str.startswith(tuple(valids))]
Out[192]: 
      a
0  aa10
1  aa11
2  bb13
Run Code Online (Sandbox Code Playgroud)