小编str*_*fry的帖子

在Python unicode字符串中处理错误编码的字符

我正在处理python-lastfm库返回的unicode字符串.

我假设在某个地方,库得到编码错误并返回一个可能包含无效字符的unicode字符串.

例如,我期望变量a中的原始字符串是"Glück"

>>> a
u'Gl\xfcck'
>>> print a
Traceback (most recent call last):
  File "", line 1, in 
UnicodeEncodeError: 'ascii' codec can't encode character u'\xfc' in position 2: ordinal not in range(128)

\ xfc是转义值252,它对应于"ü"的latin1编码.不知怎的,它以一种python无法独立处理的方式嵌入到unicode字符串中.

如何将此转换为包含原始"Glück"的普通或unicode字符串?我尝试使用解码/编码方法,但要么得到了一个UnicodeEncodeError,要么是一个包含序列\ xfc的字符串.

python string unicode character-encoding

17
推荐指数
2
解决办法
4万
查看次数

标签 统计

character-encoding ×1

python ×1

string ×1

unicode ×1