gpt4 book ai didi

cassandra - 配置多个目录后,cassandra如何拆分键空间数据?

转载 作者:行者123 更新时间:2023-12-04 03:52:35 25 4
gpt4 key购买 nike

我在cassandra.yaml文件中配置了三个单独的数据目录,如下所示:

data_file_directories:
-E:/Cassandra/data/var/lib/cassandra/data
-K:/Cassandra/data/var/lib/cassandra/data

当我创建键空间并插入数据时,在两个目录中都创建了键空间,并且数据分散了。我想知道的是cassandra如何在多个目录之间拆分数据?这背后的规则是什么?

最佳答案

在data_file_directories下添加多个条目时,您正在使用Cassandra的JBOD功能。数据按其可用空间成比例地平均分布在已配置的驱动器上。

这也让您利用disk_failure_policy设置。您可以在此处阅读有关详细信息:
http://www.datastax.com/dev/blog/handling-disk-failures-in-cassandra-1-2

简而言之,您可以将Cassandra配置为继续运行,以在磁盘已满或完全故障时执行其操作。与RAID0(在这种情况下,您实际上具有与JBOD相同的容量)相比,它具有优点,因为您不必从备份(或完全修复)中替换整个数据集,而只需对丢失的数据进行修复。另一方面,RAID0可提供更高的吞吐量(取决于您如何调优RAID阵列以匹配文件系统和驱动器几何结构)。

如果您拥有用于容错/性能更高的RAID设置的资源(例如RAID10),为简单起见,您可能只想使用一个目录即可。大多数部署都开始倾向于使用密度路线,但使用JBOD而不是系统级的容忍度。

您可以在这里阅读有关此问题发展的思考过程:
https://issues.apache.org/jira/browse/CASSANDRA-4292

关于cassandra - 配置多个目录后,cassandra如何拆分键空间数据?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/15925549/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com