小编tho*_*ann的帖子

当我解析这个XML时p = xml.parsers.expat.ParserCreate():

<name>Fortuna D&#252;sseldorf</name>

字符解析事件处理程序包括u'\xfc'.

怎么可以u'\xfc'变成u'ü'？

这是这篇文章中的主要问题,其余的只是展示了关于它的进一步(咆哮)的想法

是不是Python unicode打破了,因为u'\xfc'屈服u'ü'而没有别的？你'xfc'已经是一个unicode字符串,所以再次将它转换为unicode不起作用!将其转换为ASCII也不起作用.

我发现的唯一有用的是:(这不是故意的,对吧？)

exec( 'print u\'' + 'Fortuna D\xfcsseldorf'.decode('8859') + u'\'')

用utf-8替换8859会失败!那是什么意思？

还有什么是Python unicode HOWTO的意义？ - 它只给出了失败的例子而不是显示如何进行转换(特别是在这里提出类似问题的ppl的houndreds)实际上在现实世界中使用.

Unicode并不神奇 - 为什么这么多ppl有问题？

unicode转换的根本问题很简单:

一个双向查找表'\ xFC'< - >u'ü'

unicode( 'Fortuna D\xfcsseldorf' )

为什么Python的创建者认为显示错误而不是简单地生成错误的原因是u'Fortuna Düsseldorf'什么？

还有为什么他们让它不可逆？:

 >>> u'Fortuna Düsseldorf'.encode('utf-8')
 'Fortuna D\xc3\xbcsseldorf'
 >>> unicode('Fortuna D\xc3\xbcsseldorf','utf-8')
 u'Fortuna D\xfcsseldorf'

2
推荐指数

1
解决办法

2160
查看次数

小编tho_ann的帖子