使用AWS Lambda通过下载URL将视频上传到S3

Question

使用AWS Lambda通过下载URL将视频上传到S3

Das*_*asu 1 amazon-s3 amazon-web-services node.js aws-lambda

我想使用AWS lambda函数将视频上传到S3。该视频在我的本地计算机上不可用。我有“下载URL”。我不想将其下载到本地计算机上并上传到S3中。我正在寻找一种使用lambda函数将视频文件直接放入S3的解决方案。如果使用缓冲区或流式传输，则会消耗大量内存。有更好的解决方案吗？

非常感谢您的帮助。

Answer 1

Rez*_*emi 6

我有同样的问题，并开发了以下不依赖于/tmp磁盘限制的快速解决方案。它使用下载流作为类似文件的对象。

特征：

使用AWS Lambda Python 3.6内置的boto3和urllib3，无需外部python模块
内置分块阅读功能，非常适合下载大文件
通过urllib3池管理进行有效的连接和内存使用

使用可配置的upload_fileobj内置的分段和线程上传

import boto3
import botocore.vendored.requests.packages.urllib3 as urllib3

def lambda_handler(event, context):

    url='http://yourdownloadurl/file.tgz' # put your url here
    bucket = 'aws-s3-bucket' #your s3 bucket
    key = 'folder/filename' #your desired s3 path or filename

    s3=boto3.client('s3')
    http=urllib3.PoolManager()
    s3.upload_fileobj(http.request('GET', url,preload_content=False), bucket, key)

Run Code Online (Sandbox Code Playgroud)

无法使用 botocore 1.15.39。AttributeError：模块“botocore.vendored.requests.packages.urllib3”没有属性“PoolManager”。已验证 urllib3 1.25.8 确实有 (4认同)

Answer 2

Joh*_*ein 2

您当然可以编写一个 AWS Lambda 函数来：

从 URL 下载文件并将其存储在/tmp
使用 AWS S3 开发工具包上传到 Amazon S3

最简单的方法是下载完整的文件，而不是尝试以“位”形式对其进行流式传输。但请注意，可用于存储数据的磁盘空间限制为 500MB 。如果您的下载大小超过 500MB，您需要进行一些创造性的编程来下载其中的一部分，然后将其作为分段上传进行上传。

至于如何下载它，请使用您喜欢的任何库来下载网络文件。

归档时间：	8 年，8 月前
查看次数：	2767 次
最近记录：	8 年，2 月前