如何仅解压缩文件的一部分?

Vit*_* Py 4 gzip

我有一个大的、重复的文本文件。它压缩得很好 - 压缩了大约 3MB。但是,如果解压缩,则需要 1.7GB。由于它是重复的,我只需要输出的一小部分来检查文件的内容。

它是使用gzip. 是否gunzip提供任何方法来仅解压缩文件的前几兆?

Kus*_*nda 7

您可以解压缩到标准输出,并通过类似的东西head只捕获它的一部分:

gunzip -c file.gz | head -c 20M >file.part
Run Code Online (Sandbox Code Playgroud)

-c以标志head需要head由GNU的coreutils提供的实现。

dd 也可以使用:

gunzip -c file.gz | dd of=file.part bs=1M count=20
Run Code Online (Sandbox Code Playgroud)

这两个管道都会将未压缩文件的前 20 MiB 复制到file.part.