在AWS中存储从Pandas导出的Excel文件

Veg*_*kke 3 python amazon-s3 flask pandas

我正在使用Flask和SQLite数据库创建一个小型网站。我要做的一件事是(从数据库中)获取一些数据并将其导出为Excel文件。我想提供下载该Excel文件的选项。一种选择是使用Pandas写入将存储在Web服务器上的Excel文件,并使用Flask send_file提供下载选项。

但是,是否可以在不将文件“本地”存储在服务器上的情况下提供可下载的Excel文件?例如在AWS S3上。我希望Web服务器上具有可预测的存储大小。(然后看看是否有可能)。

一种选择是“本地”写入文件,然后将其发送到AWS,然后从服务器中删除。理想情况下,我宁愿直接捕获文件流,然后将其发送到S3,但我认为这是不可能的,因为它to_excel仅采用文件路径(或ExcelWriter对象,但采用文件路径)。

Veg*_*kke 6

要添加到balderman的答案中,将其添加到S3的完整代码是

import io
import pandas as pd
import boto3

# ...

# make data frame 'df'

with io.BytesIO() as output:
  with pd.ExcelWriter(output, engine='xlsxwriter') as writer:
    df.to_excel(writer)
  data = output.getvalue()

s3 = boto3.resource('s3')
s3.Bucket('my-bucket').put_object(Key='data.xlsx', Body=data)
Run Code Online (Sandbox Code Playgroud)

另请参阅XlsxWriter文档