cnu*_*cnu 4 python regex zip text-processing
我有超过一百万个文本文件压缩成40个zip文件.我还有一个大约500个手机型号名单.我想找出文本文件中提到的特定模型的次数.
是否有任何python模块可以对文件进行正则表达式匹配而不解压缩它.有没有解压这个问题的简单方法而不解压缩?
什么都不会自动做你想要的.
但是,有一个python zipfile模块可以让这很容易.这是如何迭代文件中的行.
#!/usr/bin/python
import zipfile
f = zipfile.ZipFile('myfile.zip')
for subfile in f.namelist():
print subfile
data = f.read(subfile)
for line in data.split('\n'):
print line
Run Code Online (Sandbox Code Playgroud)
| 归档时间: |
|
| 查看次数: |
1821 次 |
| 最近记录: |