如何使用Python通过HTTP读取远程Zip存档中的选定文件？

Question

如何使用Python通过HTTP读取远程Zip存档中的选定文件？

我需要使用Python从远程zip存档中读取与文件名匹配的所选文件.我不想将完整的zip保存到临时文件中(它不是那么大,所以我可以处理内存中的所有内容).

我已经编写了代码并且它可以工作,我自己也在回答这个问题,所以我可以在以后搜索它.但由于有证据表明我是Stackoverflow的笨蛋参与者之一,我相信还有改进的余地.

Answer 1

这是我如何做到的(抓取所有以".ranks"结尾的文件):

import urllib2, cStringIO, zipfile

try:
    remotezip = urllib2.urlopen(url)
    zipinmemory = cStringIO.StringIO(remotezip.read())
    zip = zipfile.ZipFile(zipinmemory)
    for fn in zip.namelist():
        if fn.endswith(".ranks"):
            ranks_data = zip.read(fn)
            for line in ranks_data.split("\n"):
                # do something with each line
except urllib2.HTTPError:
    # handle exception

Run Code Online (Sandbox Code Playgroud)

Answer 2

Tim*_*ker 6

感谢 Marcel 的提问和回答（我在不同的上下文中遇到了同样的问题，并且遇到了与文件类对象并非真正的文件类对象相同的困难）！正如更新：对于Python 3.0，您的代码需要稍微修改：

import urllib.request, io, zipfile

try:
    remotezip = urllib.request.urlopen(url)
    zipinmemory = io.BytesIO(remotezip.read())
    zip = zipfile.ZipFile(zipinmemory)
    for fn in zip.namelist():
        if fn.endswith(".ranks"):
            ranks_data = zip.read(fn)
            for line in ranks_data.split("\n"):
                # do something with each line
except urllib.request.HTTPError:
    # handle exception

Run Code Online (Sandbox Code Playgroud)

Answer 3

小智 5

这样无需下载整个 zip 文件即可完成工作！

http://pypi.python.org/pypi/pyremotezip

归档时间：	17 年，5 月前
查看次数：	3755 次
最近记录：	13 年，1 月前