大熊猫重复删除nans

As3*_*tin 2 python duplicates python-2.7 pandas

我正在尝试检查重复项。我使用df['name_duplicated'] = df.duplicated('name', keep=False) 但是,这会将任何带有name= 的行NaN视为重复。

有谁知道如何解决这个问题?

我正在尝试,df[pd.isnull(df['name'])]['name_duplicated'] = False但出现错误。

小智 5

您还可以尝试检查 NaN 并对重复调用的结果执行布尔值和运算

df['name_duplicated'] = df.duplicated('name', keep=False) & df['name'].notnull()
Run Code Online (Sandbox Code Playgroud)