压缩字符串存储

Bus*_*icK 6 c++ compression string algorithm data-structures

可以说我有许多包含非平凡长度的字符串(约3-4kb).字符串彼此不同但同时包含许多公共部分/子序列.平均而言,任何单个字符串的80-90%也包含在其他字符串中.是否有一种简单的方法可以自动利用这种巨大的冗余来压缩数据?
理想情况下,解决方案是C++并且对用户是透明的(即我可以使用它,就像我访问常规只读const std :: string而是从压缩存储中读取).

NPE*_*NPE 3

从算法上来说,Lempel\xe2\x80\x93Ziv\xe2\x80\x93Welch为所有对象/字符串使用一个字典可能是一个好的开始。

\n