blc*_*llo 5 bloom-filter data-structures
我理解是什么使得bloom过滤器成为一种极具吸引力 然而,我发现很难真正理解你什么时候可以使用它们,因为你仍然必须执行昂贵的操作,你试图避免确定你没有发现误报.因为这不是他们通常只会增加很多开销吗?例如,针对布隆过滤器的维基百科文章表明它们可用于数据同步.我看到第一次布隆过滤器是空的但是说你没有改变任何东西然后再次同步你的数据时会有多好.现在,每次查找布隆过滤器都会报告文件已被复制,但是我们仍然不得不预先形成我们试图避免的较慢查找任务,以确保它是正确的吗?
基本上,您使用Bloom过滤器来避免证明数据结构中不存在项目的漫长而艰巨的任务.几乎总是很难确定某些东西是否丢失,而不是存在,所以过滤器有助于弥补损失,搜索你无法找到的东西.它并不总是有效,但是当它确实带来了巨大的好处.