我有一个大的时间序列数据框(称为df),前5个记录如下所示:
df
stn years_of_data total_minutes avg_daily TOA_daily K_daily
date
1900-01-14 AlberniElementary 4 5745 34.100 114.600 0.298
1900-01-14 AlberniWeather 6 7129 29.500 114.600 0.257
1900-01-14 Arbutus 8 11174 30.500 114.600 0.266
1900-01-14 Arrowview 7 10080 27.600 114.600 0.241
1900-01-14 Bayside 7 9745 33.800 114.600 0.295
Run Code Online (Sandbox Code Playgroud)
目标:
我试图删除列表中任何字符串出现在'stn'列中的行.所以,我基本上试图过滤这个数据集,不包括包含以下列表中任何字符串的行.
尝试:
remove_list = ['Arbutus','Bayside']
cleaned = df[df['stn'].str.contains('remove_list')]
Run Code Online (Sandbox Code Playgroud)
返回:
出[78]:
stn years_of_data total_minutes avg_daily TOA_daily K_daily
date
Run Code Online (Sandbox Code Playgroud)
没有!
我尝试了一些引号,括号,甚至是lambda函数的组合; 虽然我相当新,所以可能没有正确使用语法..