相关疑难解决方法(0)

在python中逐行读取一个大的压缩文本文件

我正在尝试使用zipfile模块来读取存档中的文件.未压缩文件大约为3GB,压缩文件大小为200MB.我不希望它们在内存中,因为我逐行处理压缩文件.到目前为止,我已经注意到使用以下代码的内存过度使用:

import zipfile
f = open(...)
z = zipfile.ZipFile(f)
for line in zipfile.open(...).readlines()
  print line
Run Code Online (Sandbox Code Playgroud)

我使用SharpZipLib在C#中完成了它:

var fStream = File.OpenRead("...");
var unzipper = new ICSharpCode.SharpZipLib.Zip.ZipFile(fStream);
var dataStream =  unzipper.GetInputStream(0);
Run Code Online (Sandbox Code Playgroud)

dataStream是未压缩的.我似乎无法在Python中找到一种方法.帮助将不胜感激.

python zip stream

22
推荐指数
1
解决办法
2万
查看次数

标签 统计

python ×1

stream ×1

zip ×1