Nic*_*ick 1 python unicode encoding utf-8
假设我有以下两个变量:
bob1 = u'bob\xf0\xa4\xad\xa2'
bob2 = 'bob\xf0\xa4\xad\xa2'
我怎样才能得到值bob1的价值bob2?也就是说,如何展开unicode格式,但保留转义的十六进制值?
如果我这样做:
bob1.encode('utf8')
'bob\xc3\xb0\xc2\xa4\xc2\xad\xc2\xa2'
那是不对的...
救命!
U + 0000和U + 00FF之间的代码点映射到ISO 8859-1或Latin 1编码中的相同字节值.
>>> u'bob\xf0\xa4\xad\xa2'.encode('latin-1')
'bob\xf0\xa4\xad\xa2'
| 归档时间: | 
 | 
| 查看次数: | 317 次 | 
| 最近记录: |