小编SLa*_*k A的帖子

熊猫drop_duplicates方法不起作用

我正在尝试在数据框上使用drop_duplicates方法,但出现错误。请参阅以下内容:

错误:TypeError:无法散列的类型:“列表”

我正在使用的代码:

df = db.drop_duplicates()
Run Code Online (Sandbox Code Playgroud)

我的数据库很大,包含字符串,浮点数,日期,NaN,布尔值,整数...任何帮助,我们将不胜感激。

python pandas

12
推荐指数
3
解决办法
6994
查看次数

用NaN替换Pandas DataFrame中的空列表值

我知道以前也曾问过类似的问题,但我从字面上尝试了这里列出的所有可能的解决方案,但都没有用。

我有一个由日期,字符串,空值和空列表值组成的数据框。它非常大,有800万行。

我想替换所有空列表值-因此仅包含仅[]的单元格,而NaN则不包含其他任何单元格。似乎没有任何作用。

我尝试了这个:

df = df.apply(lambda y: np.nan if (type(y) == list and len(y) == 0) else y)
Run Code Online (Sandbox Code Playgroud)

正如在这个问题中类似建议的那样,在熊猫数据框中使用NaN替换空列表,但它不会更改我的数据框中的任何内容。

任何帮助,将不胜感激。

dataframe python-3.x pandas

3
推荐指数
1
解决办法
1687
查看次数

标签 统计

pandas ×2

dataframe ×1

python ×1

python-3.x ×1