如何使用botocore.response.StreamingBody作为stdin PIPE

Question

如何使用botocore.response.StreamingBody作为stdin PIPE

Mik*_*inn 8 python stdin python-2.7 boto3

我想将来自AWS S3的大型视频文件传输到Popen's stdin,这是从Python的角度来看的'文件类对象'.此代码作为AWS Lambda函数运行,因此这些文件不适合内存或本地文件系统.此外,我不想在任何地方复制这些巨大的文件,我只想流式传输输入,动态处理和流输出.我已经有处理和流输出位工作了.问题是如何获得输入流作为Popen pipe.

更新:我整理了一个基于注释调用StreamingBody.read(amt = chunk_size)的短程序.该程序读取一些输入文件(一个mp4视频)并被卡住,可能是因为数据的消费者(ffmpeg)实际上没有运行,或者它的STDIN缓冲区填充并且整个混乱停止了？

我可以访问S3存储桶中的文件:

import boto3
s3 = boto3.resource('s3')
response = s3.Object(bucket_name=bucket, key=key).get()
body = response['Body']

Run Code Online (Sandbox Code Playgroud)

body是botocore.response.StreamingBody这样的:

{ u'Body': <botocore.response.StreamingBody object at 0x00000000042EDAC8>, u'AcceptRanges': 'bytes', u'ContentType': 'video/mp4', 'ResponseMetadata': { 'HTTPStatusCode': 200, 'HostId': 'aAUs3IdkXP6vPGwauv6/USEBUWfxxVeueNnQVAm4odTkPABKUx1EbZO/iLcrBWb+ZiyqmQln4XU=', 'RequestId': '6B306488F6DFEEE9' }, u'LastModified': datetime.datetime(2015, 3, 1, 1, 32, 58, tzinfo=tzutc()), u'ContentLength': 393476644, u'ETag': '"71079d637e9f14a152170efdf73df679"', u'Metadata': {'cb-modifiedtime': 'Sun, 01 Mar 2015 01:27:52 GMT'}}

我打算用body这样的东西:

from subprocess import Popen, PIPE
Popen(cmd, stdin=PIPE, stdout=PIPE).communicate(input=body)[0]

Run Code Online (Sandbox Code Playgroud)

但当然body需要转换为类似文件的对象.问题是如何？

Answer 1

小智 8

用于从StreamingBody中读取二进制数据StreamBody.read().你得到一个二进制字符串.

调用read()将整个视频(数百MB)加载到RAM中.我需要一次吸入一个块来流动它 (2认同)
当StreamingBody只包含一个JSON文档时，例如物联网中的设备影子，我们如何知道它是用什么编码的？我见过很多关于它是 UTF-8 的假设，但我没有看到实际记录。 (2认同)

归档时间：	10 年前
查看次数：	13566 次
最近记录：	8 年，4 月前