我在python脚本中下载了一个网页.在大多数情况下,这很好.
但是,这个有一个响应标题:GZIP编码,当我试图打印这个网页的源代码时,它在我的putty中有所有符号.
如何将此解码为常规文本?
我一直在S3桶"测试"中关注JSON
{
'Details' : "Something"
}
Run Code Online (Sandbox Code Playgroud)
我使用以下代码来读取此JSON并打印"详细信息"键
s3 = boto3.resource('s3',
aws_access_key_id=<access_key>,
aws_secret_access_key=<secret_key>
)
content_object = s3.Object('test', 'sample_json.txt')
file_content = content_object.get()['Body'].read().decode('utf-8')
json_content = json.loads(repr(file_content))
print(json_content['Details'])
Run Code Online (Sandbox Code Playgroud)
我收到错误,因为'字符串索引必须是整数' 我不想从S3下载文件,然后阅读..
我编写了一些Python代码,用于从Web获取zip文件并将其转换为字符串:
In [1]: zip_contents[0:5]
Out[1]: 'PK\x03\x04\x14'
Run Code Online (Sandbox Code Playgroud)
我看到有一个zipfile库,但是我在查找函数时遇到了麻烦,我只能传递一堆原始zip数据.它似乎想从文件中读取它.
我真的需要将其转储到临时文件中,还是有办法绕过它?