Python文件输入字符串:如何处理转义的unicode字符?

Mic*_*chi 4 python unicode decode utf-8

在文本文件(test.txt)中,我的字符串如下所示:

Gro\u00DFbritannien
Run Code Online (Sandbox Code Playgroud)

阅读它,python逃避反斜杠:

>>> file = open('test.txt', 'r')
>>> input = file.readline()
>>> input
'Gro\\u00DFbritannien'
Run Code Online (Sandbox Code Playgroud)

我怎么能把它解释为unicode?decode()并且unicode()不会做这个工作.

以下代码写Gro\u00DFbritannien回文件,但我想要它Großbritannien

>>> input.decode('latin-1')
u'Gro\\u00DFbritannien'
>>> out = codecs.open('out.txt', 'w', 'utf-8')
>>> out.write(input)
Run Code Online (Sandbox Code Playgroud)

Ale*_*lli 9

您想使用unicode_escape编解码器:

>>> x = 'Gro\\u00DFbritannien'
>>> y = unicode(x, 'unicode_escape')
>>> print y
Großbritannien
Run Code Online (Sandbox Code Playgroud)

请参阅文档,了解作为Python标准库的一部分的大量标准编码.

  • 真好 这个人*逃脱了*我。 (2认同)