我正在尝试在数据框上使用drop_duplicates方法,但出现错误。请参阅以下内容:
错误:TypeError:无法散列的类型:“列表”
我正在使用的代码:
df = db.drop_duplicates()
Run Code Online (Sandbox Code Playgroud)
我的数据库很大,包含字符串,浮点数,日期,NaN,布尔值,整数...任何帮助,我们将不胜感激。
我知道以前也曾问过类似的问题,但我从字面上尝试了这里列出的所有可能的解决方案,但都没有用。
我有一个由日期,字符串,空值和空列表值组成的数据框。它非常大,有800万行。
我想替换所有空列表值-因此仅包含仅[]的单元格,而NaN则不包含其他任何单元格。似乎没有任何作用。
我尝试了这个:
df = df.apply(lambda y: np.nan if (type(y) == list and len(y) == 0) else y)
Run Code Online (Sandbox Code Playgroud)
正如在这个问题中类似建议的那样,在熊猫数据框中使用NaN替换空列表,但它不会更改我的数据框中的任何内容。
任何帮助,将不胜感激。