根据"不在"条件从数据框中删除行

gau*_*ani 62 python pandas

当日期列的值在日期列表中时,我想从pandas数据帧中删除行.以下代码不起作用:

a=['2015-01-01' , '2015-02-01']

df=df[df.datecolumn not in a]
Run Code Online (Sandbox Code Playgroud)

我收到以下错误:

ValueError:Series的真值是不明确的.使用a.empty,a.bool(),a.item(),a.any()或a.all().

Ffi*_*ydd 113

你可以用pandas.Dataframe.isin.

pandas.Dateframe.isin将返回布尔值,具体取决于每个元素是否在列表中a.然后使用~转换True为反转,False反之亦然.

import pandas as pd

a = ['2015-01-01' , '2015-02-01']

df = pd.DataFrame(data={'date':['2015-01-01' , '2015-02-01', '2015-03-01' , '2015-04-01', '2015-05-01' , '2015-06-01']})

print(df)
#         date
#0  2015-01-01
#1  2015-02-01
#2  2015-03-01
#3  2015-04-01
#4  2015-05-01
#5  2015-06-01

df = df[~df['date'].isin(a)]

print(df)
#         date
#2  2015-03-01
#3  2015-04-01
#4  2015-05-01
#5  2015-06-01
Run Code Online (Sandbox Code Playgroud)

  • 你可能的意思是[`Series.isin`](https://pandas.pydata.org/pandas-docs/stable/generated/pandas.Series.isin.html#pandas.Series.isin),而不是`DataFrame.isin` .你要比较一列,而不是整个df. (3认同)

YS-*_*S-L 24

你可以使用Series.isin:

df = df[~df.datecolumn.isin(a)]
Run Code Online (Sandbox Code Playgroud)

虽然错误消息表明all()any()可以使用,但仅当您希望将结果减少为单个布尔值时,它们才有用.然而,这不是你现在要做的,即测试系列中每个值与外部列表的成员资格,并保持结果完整(即布尔系列,然后将用于切片原始DataFrame) ).

您可以在Gotchas中阅读更多相关信息.