Mic*_*chi 4 python unicode decode utf-8
在文本文件(test.txt)中,我的字符串如下所示:
Gro\u00DFbritannien
Run Code Online (Sandbox Code Playgroud)
阅读它,python逃避反斜杠:
>>> file = open('test.txt', 'r')
>>> input = file.readline()
>>> input
'Gro\\u00DFbritannien'
Run Code Online (Sandbox Code Playgroud)
我怎么能把它解释为unicode?decode()并且unicode()不会做这个工作.
以下代码写Gro\u00DFbritannien回文件,但我想要它Großbritannien
>>> input.decode('latin-1')
u'Gro\\u00DFbritannien'
>>> out = codecs.open('out.txt', 'w', 'utf-8')
>>> out.write(input)
Run Code Online (Sandbox Code Playgroud)
您想使用unicode_escape编解码器:
>>> x = 'Gro\\u00DFbritannien'
>>> y = unicode(x, 'unicode_escape')
>>> print y
Großbritannien
Run Code Online (Sandbox Code Playgroud)
请参阅文档,了解作为Python标准库的一部分的大量标准编码.
| 归档时间: |
|
| 查看次数: |
2593 次 |
| 最近记录: |