小编SLa*_*k A的帖子

我正在尝试在数据框上使用drop_duplicates方法，但出现错误。请参阅以下内容：

错误：TypeError：无法散列的类型：“列表”

我正在使用的代码：

df = db.drop_duplicates()

我的数据库很大，包含字符串，浮点数，日期，NaN，布尔值，整数...任何帮助，我们将不胜感激。

12
推荐指数

3
解决办法

6994
查看次数

我知道以前也曾问过类似的问题，但我从字面上尝试了这里列出的所有可能的解决方案，但都没有用。

我有一个由日期，字符串，空值和空列表值组成的数据框。它非常大，有800万行。

我想替换所有空列表值-因此仅包含仅[]的单元格，而NaN则不包含其他任何单元格。似乎没有任何作用。

我尝试了这个：

df = df.apply(lambda y: np.nan if (type(y) == list and len(y) == 0) else y)

正如在这个问题中类似建议的那样，在熊猫数据框中使用NaN替换空列表，但它不会更改我的数据框中的任何内容。

任何帮助，将不胜感激。

3
推荐指数

1
解决办法

1687
查看次数

小编SLa_k A的帖子