带有acute的拉丁字母:DjangoUnicodeDecodeError

pan*_*ore 1 python django utf-8 character-encoding

我有一个问题,读取一个txt文件插入mysql数据库表,te sniped这段代码:

文件包含第一行:" aclaración "

archivo = open('file.txt',"r")
表示archivo.readlines()中的行:
.... body = body + line
model = MyModel(body = body)
model.save()

我得到一个DjangoUnicodeDecodeError:

'utf8'编解码器无法解码位置8中的字节:无效数据.你传入'aclaraci\xf3n'(类型'str')Unicode错误提示

无法编码/解码的字符串是:araci n.

我尝试了body.decode('utf-8'),body.decode('latin-1'),body.decode('iso-8859-1'),没有解决方案.

你能帮我吗?任何提示都是apreciated :)

Ale*_*lli 5

\xf3'ó' 的代码来看,它看起来像是在ISO-8859-1(或一些近亲)中编码的数据.所以body.decode('iso-8859-1')应该是一个有效的Unicode字符串(你没有指定"没有解决方案"的意思 - 你得到什么错误信息,在哪里?); 如果您需要的是一个utf-8编码的字节串,那么body.decode('iso-8859-1').encode('utf-8')应该给你一个!