gpt4 book ai didi

cassandra - 如何理解Cassandra中的bloom_filter_fp_chance和read_repair_chance

转载 作者:行者123 更新时间:2023-12-04 13:49:03 28 4
gpt4 key购买 nike

布隆过滤器

When data is requested, the Bloom filter checks if the row exists before doing disk I/O. 

阅读修复
Read Repair perform a digest query on all replicas for that key

我的困惑是如何将此值设置在 0 到 1 之间。当值发生变化时会发生什么?

提前致谢,。

最佳答案

bloom_filter_fp_chance 和 read_repair_chance 控制两个不同的东西。通常,您会将它们设置为默认值,这对于大多数典型用例来说应该可以很好地工作。

bloom_filter_fp_chance 控制存储在磁盘上的 SSTable 的布隆过滤器数据的精度。布隆过滤器保存在内存中,当您进行读取时,Cassandra 将检查布隆过滤器以查看哪些 SSTable 可能具有您正在读取的键的数据。布隆过滤器通常会给出误报,当您实际阅读 SSTable 时,结果发现 SSTable 中不存在 key ,阅读它是在浪费时间。用于布隆过滤器的精度越高,它给出的误报就越少(但它需要的内存越多)。

从文档:

0 Enables the unmodified, effectively the largest possible, Bloom filter
1.0 Disables the Bloom Filter
The recommended setting is 0.1. A higher value yields diminishing returns.

因此,在读取布隆过滤器时,数字越大,出现误报 (fp) 的可能性就越大。

read_repair_chance 控制对 key 的读取将与该 key 的其他副本进行检查的概率。如果您的系统节点频繁停机导致数据不同步,这将非常有用。如果您进行大量读取,那么读取修复将在您读取时缓慢地使数据恢复同步,而无需在节点上运行完整修复。较高的设置将导致更多的后台读取修复并消耗更多资源,但会在读取时更快地同步数据。

请参阅有关这些设置的文档 here .

关于cassandra - 如何理解Cassandra中的bloom_filter_fp_chance和read_repair_chance,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/31785110/

28 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com