小编Art*_*nui的帖子

布隆过滤器在交叉点/联合上的误报率会增加吗?

没有找到任何关于此的内容,所以我希望我的问题能在这里找到答案。

问题集:

一切都属于使用布隆过滤器的提升挖掘。

我有数千个布隆过滤器,最大容量为 M,每个过滤器中的项目数为 N。

对于N在任何情况下都不会到达 M的情况。

误报概率 P - 0.001%

在我的问题中,我需要从几个到 ±5 个增量交叉点逐步执行,

A?乙?C ?迪...

将针对不同长度的不同集合组合的任意大数量(或小数量,取决于我的成本函数)执行此类操作

一种 ?乙; 一种 ?? K; ? ? ……?Z; 等等。

所有接收到的(新的)交集作为布隆过滤器(BF?i),将通过联合操作进行组合,

BF1 U BF2 U ... U BFi


问题:

布隆过滤器上的此类操作是否会影响最终组合布隆过滤器(多个交叉点的并集)的误报率,因为我可能有很多这样的操作?

我如何估计我的案例可能的准确度/精确度损失(或者误报率增加)?

将非常感谢对相关材料的任何提示或指导!

probability bloom-filter bigdata data-structures data-science

0
推荐指数
1
解决办法
902
查看次数