我试图在python中读取一个gunzipped文件(.gz),但我遇到了一些麻烦.
我使用gzip模块读取它,但文件被编码为utf-8文本文件,因此最终它会读取无效字符并崩溃.
有谁知道如何读取编码为utf-8文件的gzip文件?我知道有一个编解码器模块可以提供帮助,但我无法理解如何使用它.
谢谢!
import string
import gzip
import codecs
f = gzip.open('file.gz','r')
engines = {}
line = f.readline()
while line:
parsed = string.split(line, u'\u0001')
#do some things...
line = f.readline()
for en in engines:
print(en)
Run Code Online (Sandbox Code Playgroud)