我有一个 ASCII 编码的文本文件,其中每一行都具有以下结构:
\n\nXYplorer nn.nn.nnnn [yyyy-mm-dd hh.mm.ss] [S256 S256].zip\n \xe2\x86\x91\xe2\x86\x91 \xe2\x86\x91\xe2\x86\x91 \xe2\x86\x91\xe2\x86\x91\xe2\x86\x91\xe2\x86\x91 \xe2\x86\x91\xe2\x86\x91\xe2\x86\x91\xe2\x86\x91 \xe2\x86\x91\xe2\x86\x91 \xe2\x86\x91\xe2\x86\x91 \xe2\x86\x91\xe2\x86\x91 \xe2\x86\x91\xe2\x86\x91 \xe2\x86\x91\xe2\x86\x91 \xe2\x86\x9164\xc3\x97 \xe2\x86\x9164\xc3\x97\nRun Code Online (Sandbox Code Playgroud)\n\n所以一行有 177 个字符长,其中 27 个字符不变,另外 150 个字符不变,这两个哈希值组成了 128 个这样的字符。我还假设哈希值基本上是随机文本,因此难以压缩,所以
\n\n27/177 = 15.3%固定文本
22/177 = 12.4%改变文字
128/177 = 72.3%随机文本
然而,在 Windows 上以标准(右键单击)方式压缩此类文件(1854 行)时,我获得了 49% 的压缩率,这让我感到困惑,因为它似乎太高/高效了。
\n\n你能向我解释一下随机部分是如何被压缩这么多的吗?
\n