Ald*_*und 0 python unicode encoding utf-8 python-2.x
我在js中有以下字符串。
*"form-uploads/2015 Perry's Awärds Letter.jpg"*
Run Code Online (Sandbox Code Playgroud)
它有一个ä符号。
当我使用btoa(在chrome中)在js中对其进行编码时,我得到以下信息: “ Zm9ybS11cGxvYWRzLzIwMTUgUGVycnkncyBBd + RyZHMgTGV0dGVyLmpwZw ==”
当我尝试用python对其进行解码时,我得到以下信息:
In[16]: base64.b64decode('Zm9ybS11cGxvYWRzLzIwMTUgUGVycnkncyBBd+RyZHMgTGV0dGVyLmpwZw==')
Out[16]: "form-uploads/2015 Perry's Aw\xe4rds Letter.jpg"
Run Code Online (Sandbox Code Playgroud)
因此,ä迷路了,如果我尝试对该字符串进行解码,则会utf-8出错。
In[18]: base64.b64decode('Zm9ybS11cGxvYWRzLzIwMTUgUGVycnkncyBBd+RyZHMgTGV0dGVyLmpwZw==').decode('utf-8')
UnicodeDecodeError: 'utf8' codec can't decode byte 0xe4 in position 28: invalid continuation byte
Run Code Online (Sandbox Code Playgroud)
解码后如何i获得正确utf-8 ä的python代码?
您需要使用latin1编码进行解码,然后打印Unicode:
>>> print base64.b64decode(u'Zm9ybS11cGxvYWRzLzIwMTUgUGVycnkncyBBd+RyZHMgTGV0dGVyLmpwZw==').decode('latin1')
form-uploads/2015 Perry's Awärds Letter.jpg
Run Code Online (Sandbox Code Playgroud)
| 归档时间: |
|
| 查看次数: |
1343 次 |
| 最近记录: |