gpt4 book ai didi

algorithm - 布隆过滤器实现如何保持清洁?

转载 作者:塔克拉玛干 更新时间:2023-11-03 03:32:03 25 4
gpt4 key购买 nike

由于它们填满并且误报的百分比增加,有哪些技术可以防止它们饱和?似乎您不能清空位,因为这会立即对该节点中存储的数据产生负面影响。

即使您有一个已知大小的集合,在使用像 Cassandra 这样的布隆过滤器的数据存储中,让我感到困惑的是节点中的数据将被添加和删除,对吗?但是,当您删除一个键时,您不能将其布隆过滤器桶设置为 0,因为这可能会对散列到一个或多个与删除键相同的桶的节点中的数据造成漏报。所以随着时间的推移,就好像过滤器被填满了

最佳答案

我认为您需要为布隆过滤器覆盖的集合大小设置一个上限。如果集合超过该大小,则需要重新计算布隆过滤器。

如在 cassandra 中使用的那样,布隆过滤器覆盖的集合的大小在创建过滤器之前是已知的,因此这不是问题。

另一种方法是 Scalable Bloom Filters

关于algorithm - 布隆过滤器实现如何保持清洁?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/7049027/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com