编码位向量的有效方法?

Cho*_*rop 7 optimization performance encoding bitmap bitvector

目前使用行程长度编码来编码位向量,当前运行时间是2log(i),其中是运行的大小.还有另一种方法可以将其归结为log(i)吗?谢谢.

Ask*_*ein 6

编码位向量的最有效方法是隔离位源的任何特定属性.如果它是完全随机的,则没有明显的增益(实际上,完全随机的比特流不能以任何方式压缩).

如果您可以在比特流中找到属性,则可以尝试定义一组矢量,这些矢量将定义矢量空间的基础.在这种情况下,结果将非常有效.

我们需要您的比特流的更多细节.


(编辑)

还有一些细节可以理解前面的陈述:"完全随机的比特流不能以任何方式压缩"

如果通过"压缩"我们指的是"变换/压缩流" 加上 "矢量基定义" 加上解压缩程序,则不可能压缩完全随机的比特矢量.但在大多数情况下,解压缩程序(通常也是矢量库)都嵌入在客户端软件中.因此,仅需要"压缩流".

一个很好的解释(和有趣的故事)是Patrick Craig 5000 $压缩挑战

更科学的信息理论,特别是熵部分

而且,最后一个,全文.

但无论解决方案是什么,如果您有未知数量的未知流来压缩,您将无法做任何事情.你必须找到一个模式.