gpt4 book ai didi

cassandra - 如何检查 Cassandra 在集群中均匀分布数据

转载 作者:行者123 更新时间:2023-12-02 23:46:06 24 4
gpt4 key购买 nike

我是 Cassandra 的新手,我创建了一个具有以下规范的 Clusterer。

如何确保 Cassandra 在集群中均匀分布数据?

node count: 4
replication_factor: 3

表架构:

CREATE TABLE space.user (
id uuid PRIMARY KEY,
firstname text,
lastname text
) WITH bloom_filter_fp_chance = 0.01
AND caching = {'keys': 'ALL', 'rows_per_partition': 'NONE'}
AND comment = ''
AND compaction = {'class': 'org.apache.cassandra.db.compaction.SizeTieredCompactionStrategy', 'max_threshold': '32', 'min_threshold': '4'}
AND compression = {'chunk_length_in_kb': '64', 'class': 'org.apache.cassandra.io.compress.LZ4Compressor'}
AND crc_check_chance = 1.0
AND dclocal_read_repair_chance = 0.1
AND default_time_to_live = 0
AND gc_grace_seconds = 864000
AND max_index_interval = 2048
AND memtable_flush_period_in_ms = 0
AND min_index_interval = 128
AND read_repair_chance = 0.0
AND speculative_retry = '99PERCENTILE';

最佳答案

最简单的方法是使用nodetool status - 你 can check Load 列中显示了多少 - 这是磁盘上的数据量,不过,它也可以计算未清理的数据(如果您更改了拓扑,则可能需要运行 nodetool cleanup 以删除该数据)。

基本上,节点之间不应该有很大差异,但这取决于您指定为 num_tokens 的数字。如果每台服务器有 8 个 token ,则与平均大小的差异可能为 +-10-12%。对于更多数量的 token ,差异可能更小。

但就你的情况而言,我认为节点之间的差异不会很大,因为你的行非常小,而名字/姓氏应该很大。

关于cassandra - 如何检查 Cassandra 在集群中均匀分布数据,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/53045138/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com