没有找到任何关于此的内容,所以我希望我的问题能在这里找到答案。
问题集:
一切都属于使用布隆过滤器的提升挖掘。
我有数千个布隆过滤器,最大容量为 M,每个过滤器中的项目数为 N。
对于N在任何情况下都不会到达 M的情况。
误报概率 P - 0.001%
在我的问题中,我需要从几个到 ±5 个增量交叉点逐步执行,
像A?乙?C ?迪...
将针对不同长度的不同集合组合的任意大数量(或小数量,取决于我的成本函数)执行此类操作
一种 ?乙; 一种 ?? K; ? ? ……?Z; 等等。
所有接收到的(新的)交集作为布隆过滤器(BF?i),将通过联合操作进行组合,
BF1 U BF2 U ... U BFi
问题:
布隆过滤器上的此类操作是否会影响最终组合布隆过滤器(多个交叉点的并集)的误报率,因为我可能有很多这样的操作?
我如何估计我的案例可能的准确度/精确度损失(或者误报率增加)?
将非常感谢对相关材料的任何提示或指导!
probability bloom-filter bigdata data-structures data-science