我有一个与python(IPython笔记本)中的编码问题有关的问题.由于这类问题非常普遍和简单,但我仍然无法真正解决它.
我这里有一个CSV文件,你可以看到我们在这个文件中有很多'\ xa0'和其他'\n'字符.
我用了
with io.open(train_fname) as f:
for line in f:
line = line.encode("ascii", "replace")
Run Code Online (Sandbox Code Playgroud)
但它不起作用,我总是得到以下输出.
想象一下,你可以说,你知道什么,没有制裁,没有永久听取IEAA的规定,不再隐藏\ xa0under\xa0借助友好的核能.\ xa0你有2天的时间;\xa0i.e.在检查员中,退出杀害平民.
我试过其他方法
line.replace(u"\xa0", " ")
它也没有用,我也尝试了各种编码在我的文本编辑,崇高文本中打开这个CSV文件.我尝试了windows-1252,utf-8和所有其他编码,但在查看此CSV文件时,我总是得到\ xa0是我的文本编辑.
这是否意味着
\ XA0
已经在此CSV文件中写为输入文本?这不是python编码的问题吗?如果是这种情况,为什么我不能使用replace方法来简单地替换这个字符串?\ xa0表示文件编码在哪?编码?这意味着这个文件是用utf-8编写的,但我试图在ascii或其他情况下打开它?
我搜索了许多问题,但似乎没有提供太多帮助.如果我的问题不是很清楚,请问我.非常感谢你!
`