如何在文件中列出第一行或最后10行而不在Linux中解压缩

Wil*_*m A 4 linux

我有一个.bz2文件.我想列出第一行或最后10行而不解压缩,因为它太大了.我试过了head -10,tail -10但我看到了胡言乱语.我还需要比较两个压缩文件,以检查它们是否相似.如何在不解压缩文件的情况下实现这一目标?

编辑:类似意味着相同(具有相同的内容).

twa*_*erg 8

虽然bzip2是基于块的压缩算法,但理论上你可以找到你想要解压缩的特定块,这会很复杂(例如,如果你最终希望看到的最后十行实际上跨越两个或更多个压缩块会怎么样?) .

要回答您的直接问题,您可以执行此操作,实际上解压缩整个文件,因此在某种意义上是浪费,但它不会尝试将该文件存储在任何位置,因此您不会遇到存储容量问题:

bzcat file.bz2 | head -10
bzcat file.bz2 | tail -10
Run Code Online (Sandbox Code Playgroud)

如果您的发行版不包含bzcat(根据我的经验会有点不寻常),bzcat相当于bzip2 -d -c.

但是,如果您的最终目标是比较两个压缩文件(可能已在不同级别压缩,因此直接比较实际压缩文件不起作用),您可以这样做(假设bash您的shell):

cmp <(bzcat file1.bz2) <(bzcat file2.bz2)
Run Code Online (Sandbox Code Playgroud)

这将解压缩两个文件并逐字节地比较未压缩数据,而无需将任何解压缩文件存储在任何地方.