循环搜索要搜索的二元组列表,我需要根据每个二元组是否存在于标记化的 pandas 系列中为每个二元组创建一个布尔字段。如果您认为这是一个好问题,我将不胜感激!
二元组列表:
bigrams = ['data science', 'computer science', 'bachelors degree']
Run Code Online (Sandbox Code Playgroud)
数据框:
df = pd.DataFrame(data={'job_description': [['data', 'science', 'degree', 'expert'],
['computer', 'science', 'degree', 'masters'],
['bachelors', 'degree', 'computer', 'vision'],
['data', 'processing', 'science']]})
Run Code Online (Sandbox Code Playgroud)
期望的输出:
job_description data science computer science bachelors degree
0 [data, science, degree, expert] True False False
1 [computer, science, degree, masters] False True False
2 [bachelors, degree, computer, vision] False False True
3 [data, bachelors, science] False False False
Run Code Online (Sandbox Code Playgroud)
标准:
我尝试过的:
失败的: df = …