Gre*_*ant 2 python utf-8 flask
我正在通过 Flask 创建一个文件服务器。当我测试下载功能时,我发现如果我尝试下载以 UTF-8 字符命名的文件,则会引发 UnicodeEncodeError。
在 处创建一个文件upload/1512026299/%E6%97%A0%E6%A0%87%E9%A2%98.png,然后运行以下代码:
@app.route('/getfile/<timestamp>/<filename>')
def download(timestamp, filename):
dirpath = os.path.join(os.path.join(os.path.abspath(os.path.dirname(__file__)), 'upload'), timestamp)
return send_from_directory(dirpath, filename, as_attachment=True)
Run Code Online (Sandbox Code Playgroud)
你会得到一个异常,它应该是这样的:
127.0.0.1 - - [30/Nov/2017 21:39:05] "GET /getfile/1512026299/%E6%97%A0%E6%A0%87%E9%A2%98.png HTTP/1.1" 200 -
Error on request:
Traceback (most recent call last):
File "C:\Program Files\Python36\lib\site-packages\werkzeug\serving.py", line 209, in run_wsgi
execute(self.server.app)
File "C:\Program Files\Python36\lib\site-packages\werkzeug\serving.py", line 200, in execute
write(data)
File "C:\Program Files\Python36\lib\site-packages\werkzeug\serving.py", line 168, in write
self.send_header(key, value)
File "C:\Program Files\Python36\lib\http\server.py", line 508, in send_header
("%s: %s\r\n" % (keyword, value)).encode('latin-1', 'strict'))
UnicodeEncodeError: 'latin-1' codec can't encode characters in position 43-45: ordinal not in range(256)
Run Code Online (Sandbox Code Playgroud)
问题是,当使用as_attachement=True文件名时,文件名是在标头中发送的。不幸的是,flask 似乎还不支持rfc5987,它指定如何以 latin1 以外的不同编码对附件文件名进行编码。
在这种情况下,最简单的解决方案是 drop as_attachement=True,那么它就不会与Content-Disposition标头一起发送,从而避免了这个问题。
如果您确实必须发送标头,您可以尝试相关问题Content-Disposition中发布的代码:
response = make_response(send_file(out_file))
basename = os.path.basename(out_file)
response.headers["Content-Disposition"] = \
"attachment;" \
"filename*=UTF-8''{utf_filename}".format(
utf_filename=quote(basename.encode('utf-8'))
)
return response
Run Code Online (Sandbox Code Playgroud)
这应该在下一个版本(>0.12)中修复