小编Mar*_*rco的帖子

使用 sha256 哈希值压缩文本文件似乎效率太高

我有一个 ASCII 编码的文本文件,其中每一行都具有以下结构:

\n\n
XYplorer nn.nn.nnnn [yyyy-mm-dd hh.mm.ss] [S256 S256].zip\n         \xe2\x86\x91\xe2\x86\x91 \xe2\x86\x91\xe2\x86\x91 \xe2\x86\x91\xe2\x86\x91\xe2\x86\x91\xe2\x86\x91  \xe2\x86\x91\xe2\x86\x91\xe2\x86\x91\xe2\x86\x91 \xe2\x86\x91\xe2\x86\x91 \xe2\x86\x91\xe2\x86\x91 \xe2\x86\x91\xe2\x86\x91 \xe2\x86\x91\xe2\x86\x91 \xe2\x86\x91\xe2\x86\x91   \xe2\x86\x9164\xc3\x97 \xe2\x86\x9164\xc3\x97\n
Run Code Online (Sandbox Code Playgroud)\n\n

所以一行有 177 个字符长,其中 27 个字符不变,另外 150 个字符不变,这两个哈希值组成了 128 个这样的字符。我还假设哈希值基本上是随机文本,因此难以压缩,所以

\n\n

27/177 = 15.3%固定文本

\n\n

22/177 = 12.4%改变文字

\n\n

128/177 = 72.3%随机文本

\n\n

然而,在 Windows 上以标准(右键单击)方式压缩此类文件(1854 行)时,我获得了 49% 的压缩率,这让我感到困惑,因为它似乎太高/高效了。

\n\n

你能向我解释一下随机部分是如何被压缩这么多的吗?

\n

compression zip

3
推荐指数
1
解决办法
1087
查看次数

标签 统计

compression ×1

zip ×1