当发送带有 UTF-8 字符的附件时,Flask 会引发 UnicodeEncodeError (latin-1)

Gre*_*ant 2 python utf-8 flask

我正在通过 Flask 创建一个文件服务器。当我测试下载功能时,我发现如果我尝试下载以 UTF-8 字符命名的文件,则会引发 UnicodeEncodeError。

在 处创建一个文件upload/1512026299/%E6%97%A0%E6%A0%87%E9%A2%98.png,然后运行以下代码:

@app.route('/getfile/<timestamp>/<filename>')
def download(timestamp, filename):
    dirpath = os.path.join(os.path.join(os.path.abspath(os.path.dirname(__file__)), 'upload'), timestamp)
    return send_from_directory(dirpath, filename, as_attachment=True)
Run Code Online (Sandbox Code Playgroud)

你会得到一个异常,它应该是这样的:

127.0.0.1 - - [30/Nov/2017 21:39:05] "GET /getfile/1512026299/%E6%97%A0%E6%A0%87%E9%A2%98.png HTTP/1.1" 200 -
Error on request:
Traceback (most recent call last):
  File "C:\Program Files\Python36\lib\site-packages\werkzeug\serving.py", line 209, in run_wsgi
    execute(self.server.app)
  File "C:\Program Files\Python36\lib\site-packages\werkzeug\serving.py", line 200, in execute
    write(data)
  File "C:\Program Files\Python36\lib\site-packages\werkzeug\serving.py", line 168, in write
    self.send_header(key, value)
  File "C:\Program Files\Python36\lib\http\server.py", line 508, in send_header
    ("%s: %s\r\n" % (keyword, value)).encode('latin-1', 'strict'))
UnicodeEncodeError: 'latin-1' codec can't encode characters in position 43-45: ordinal not in range(256)
Run Code Online (Sandbox Code Playgroud)

mat*_*ata 7

问题是,当使用as_attachement=True文件名时,文件名是在标头中发送的。不幸的是,flask 似乎还不支持rfc5987,它指定如何以 latin1 以外的不同编码对附件文件名进行编码。

在这种情况下,最简单的解决方案是 drop as_attachement=True,那么它就不会与Content-Disposition标头一起发送,从而避免了这个问题。

如果您确实必须发送标头,您可以尝试相关问题Content-Disposition中发布的代码:

    response = make_response(send_file(out_file))
    basename = os.path.basename(out_file)
    response.headers["Content-Disposition"] = \
        "attachment;" \
        "filename*=UTF-8''{utf_filename}".format(
            utf_filename=quote(basename.encode('utf-8'))
        )
    return response
Run Code Online (Sandbox Code Playgroud)

这应该在下一个版本(>0.12)中修复