删除熊猫数据框中的特殊字符

SKl*_*ein 4 python dataframe python-3.x pandas jupyter-notebook

我找到了有关如何完成此操作的信息,但没有任何帮助。我正在尝试替换特殊字符“ð”。我从csv文件中导入了数据,并且使用了encoding ='latin1',否则我一直报错。但是,简单的DF ['Column']。str.replace('ð','')不会解决问题。我也尝试解码并使用该字符的十六进制值,这在另一篇文章中被推荐,但对我来说仍然行不通。非常感谢您的帮助,如有必要,我愿意发布代码。

cs9*_*s95 7

str.encode依次致电str.decode

df.YourCol.str.encode('utf-8').str.decode('ascii', 'ignore')
Run Code Online (Sandbox Code Playgroud)

如果要对多列执行此操作,可以切片并调用df.applymap

df[col_list].applymap(lambda x: x.encode('utf-8').decode('ascii', 'ignore'))
Run Code Online (Sandbox Code Playgroud)

请记住,这些操作不是就地执行的。因此,您必须将这些列分配回其应有的位置。