我正在使用Python,不幸的是我的代码需要将表示字符串的utf-8代码的字符串转换为原始字符串,如:
我从其他代码获得的UTF-8代码字符串:
\u6b22\u8fce\u63d0\u4ea4\u5fae\u535a\u641c\u7d22\u4f7f\u7528\u53cd\u9988\uff0c\u8bf7\u76f4\u63a5
Run Code Online (Sandbox Code Playgroud)
我需要将它转换回原始字符串.怎么做?
Mar*_*nen 17
我想这就是你想要的.它不是UTF-8字节字符串(从技术上来说,它是,但仅仅因为ASCII是UTF-8的子集).
>>> s='\u6b22\u8fce\u63d0\u4ea4\u5fae\u535a\u641c\u7d22\u4f7f\u7528\u53cd\u9988\uff0c\u8bf7\u76f4\u63a5'
>>> print s.decode('unicode-escape')
????????????????
Run Code Online (Sandbox Code Playgroud)
仅供参考,这是UTF-8:
>>> s.decode('unicode-escape').encode('utf8')
Run Code Online (Sandbox Code Playgroud)
"\ XE6\XAC\XA2\xe8\XBF\x8e\XE6\X8F\X90\XE4\XBA\XA4\xe5\XBE\XAE\xe5\x8d\x9a\XE6\X90\x9c\XE7\XB4\XA2\XE4\XBD\XBF\XE7\X94\xa8\xe5\X8F\x8d\xe9\xa6\X88\XEF\XBC\x8c\xe8\XAF\XB7\XE7\x9b\XB4\XE6\x8e\xa5'
| 归档时间: |
|
| 查看次数: |
13909 次 |
| 最近记录: |