对于我的用例,最有效的位向量压缩方法是什么?

fok*_*ute 8 c compression indexing bit-manipulation bitmap


我正在从事计算生物学项目,我需要存储许多序列之间不同的基因座索引.现在,我正在使用B +树来实现这个目的,但我想使用位图索引对于这样一个用例会更快:两个序列之间只有少数基因座不同,平均为1%,而且它们是沿序列分布几乎相等; 所以似乎有很大的位图索引压缩空间.我的问题是我无法找到一种可以高效的压缩方法:

  • 允许快速个别位设置/取消设置
  • 允许对位图进行有效的范围查询
  • 可能允许两个索引的快速异或/和

请提前获取您的建议.