Python文件输入字符串:如何处理转义的unicode字符？

Question

在文本文件(test.txt)中,我的字符串如下所示:

Gro\u00DFbritannien

阅读它,python逃避反斜杠:

>>> file = open('test.txt', 'r')
>>> input = file.readline()
>>> input
'Gro\\u00DFbritannien'

我怎么能把它解释为unicode？decode()并且unicode()不会做这个工作.

以下代码写Gro\u00DFbritannien回文件,但我想要它Großbritannien

>>> input.decode('latin-1')
u'Gro\\u00DFbritannien'
>>> out = codecs.open('out.txt', 'w', 'utf-8')
>>> out.write(input)

Answer 1

您想使用unicode_escape编解码器:

>>> x = 'Gro\\u00DFbritannien'
>>> y = unicode(x, 'unicode_escape')
>>> print y
Großbritannien

请参阅文档,了解作为Python标准库的一部分的大量标准编码.