相关疑难解决方法(0)

从python中的gzip文件中读取utf-8字符

我试图在python中读取一个gunzipped文件(.gz),但我遇到了一些麻烦.

我使用gzip模块读取它,但文件被编码为utf-8文本文件,因此最终它会读取无效字符并崩溃.

有谁知道如何读取编码为utf-8文件的gzip文件?我知道有一个编解码器模块可以提供帮助,但我无法理解如何使用它.

谢谢!

import string
import gzip
import codecs

f = gzip.open('file.gz','r')

engines = {}
line = f.readline()
while line:
    parsed = string.split(line, u'\u0001')

    #do some things...

    line = f.readline()
for en in engines:
  print(en)
Run Code Online (Sandbox Code Playgroud)

python file-io gzip utf-8

27
推荐指数
4
解决办法
2万
查看次数

标签 统计

file-io ×1

gzip ×1

python ×1

utf-8 ×1