zlib.error:解压缩时出错-3:不正确的标头检查

Var*_*yas 50 python gzip zlib

我有一个gzip文件,我试图通过Python读取它,如下所示:

import zlib

do = zlib.decompressobj(16+zlib.MAX_WBITS)
fh = open('abc.gz', 'rb')
cdata = fh.read()
fh.close()
data = do.decompress(cdata)
Run Code Online (Sandbox Code Playgroud)

它会抛出此错误:

zlib.error: Error -3 while decompressing: incorrect header check
Run Code Online (Sandbox Code Playgroud)

我怎么能克服它?

dno*_*zay 104

你有这个错误:

zlib.error: Error -3 while decompressing: incorrect header check
Run Code Online (Sandbox Code Playgroud)

这很可能是因为您正在尝试检查不存在的标头,例如您的数据遵循RFC 1951(deflate压缩格式)而不是RFC 1950(zlib压缩格式)或RFC 1952(gzip压缩格式).

选择windowBits

但是zlib可以解压缩所有这些格式:

  • (去)压缩deflate格式,使用wbits = -zlib.MAX_WBITS
  • (去)压缩zlib格式,使用wbits = zlib.MAX_WBITS
  • (去)压缩gzip格式,使用wbits = zlib.MAX_WBITS | 16

请参阅http://www.zlib.net/manual.html#Advanced(部分inflateInit2)中的文档

例子

测试数据:

>>> deflate_compress = zlib.compressobj(9, zlib.DEFLATED, -zlib.MAX_WBITS)
>>> zlib_compress = zlib.compressobj(9, zlib.DEFLATED, zlib.MAX_WBITS)
>>> gzip_compress = zlib.compressobj(9, zlib.DEFLATED, zlib.MAX_WBITS | 16)
>>> 
>>> text = '''test'''
>>> deflate_data = deflate_compress.compress(text) + deflate_compress.flush()
>>> zlib_data = zlib_compress.compress(text) + zlib_compress.flush()
>>> gzip_data = gzip_compress.compress(text) + gzip_compress.flush()
>>> 
Run Code Online (Sandbox Code Playgroud)

明显的测试zlib:

>>> zlib.decompress(zlib_data)
'test'
Run Code Online (Sandbox Code Playgroud)

测试deflate:

>>> zlib.decompress(deflate_data)
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
zlib.error: Error -3 while decompressing data: incorrect header check
>>> zlib.decompress(deflate_data, -zlib.MAX_WBITS)
'test'
Run Code Online (Sandbox Code Playgroud)

测试gzip:

>>> zlib.decompress(gzip_data)
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
zlib.error: Error -3 while decompressing data: incorrect header check
>>> zlib.decompress(gzip_data, zlib.MAX_WBITS|16)
'test'
Run Code Online (Sandbox Code Playgroud)

数据也与gzip模块兼容:

>>> import gzip
>>> import StringIO
>>> fio = StringIO.StringIO(gzip_data)  # io.BytesIO for Python 3
>>> f = gzip.GzipFile(fileobj=fio)
>>> f.read()
'test'
>>> f.close()
Run Code Online (Sandbox Code Playgroud)

自动头检测(zlib或gzip)

加入32windowBits将触发标题检测

>>> zlib.decompress(gzip_data, zlib.MAX_WBITS|32)
'test'
>>> zlib.decompress(zlib_data, zlib.MAX_WBITS|32)
'test'
Run Code Online (Sandbox Code Playgroud)

使用gzip而不是

或者你可以直接忽略zlib和使用gzip模块; 但请记住,引擎盖下,gzip使用zlib.

fh = gzip.open('abc.gz', 'rb')
cdata = fh.read()
fh.close()
Run Code Online (Sandbox Code Playgroud)

  • 这个:`zlib.decompress(gzip_data,zlib.MAX_WBITS | 32)` (5认同)
  • @dnozay,我尝试使用您提到的上述“zlib.decompress(zlib_data, zlib.MAX_WBITS|32)”调整,但它没有起作用。我仍然收到“标头检查不正确”错误。如果我尝试使用上面提到的其他选项,我仍然会收到各种错误。还有其他什么可能触发此错误吗? (2认同)

Dav*_*her 4

更新dnozay 的答案解释了问题,应该是公认的答案。


尝试该gzip模块,下面的代码直接来自python 文档

import gzip
f = gzip.open('/home/joe/file.txt.gz', 'rb')
file_content = f.read()
f.close()
Run Code Online (Sandbox Code Playgroud)