在zip文件中是否有用于正则表达式匹配的python模块

cnu*_*cnu 4 python regex zip text-processing

我有超过一百万个文本文件压缩成40个zip文件.我还有一个大约500个手机型号名单.我想找出文本文件中提到的特定模型的次数.

是否有任何python模块可以对文件进行正则表达式匹配而不解压缩它.有没有解压这个问题的简单方法而不解压缩?

Mar*_*son 9

什么都不会自动做你想要的.

但是,有一个python zipfile模块可以让这很容易.这是如何迭代文件中的行.

#!/usr/bin/python

import zipfile
f = zipfile.ZipFile('myfile.zip')

for subfile in f.namelist():
    print subfile
    data = f.read(subfile)
    for line in data.split('\n'):
        print line
Run Code Online (Sandbox Code Playgroud)