gpt4 book ai didi

cassandra - Cassandra 什么时候遇到阿姆达尔定律?

转载 作者:行者123 更新时间:2023-12-04 11:42:49 25 4
gpt4 key购买 nike

我试图理解 Cassandra 与节点数量呈线性关系的说法。在快速浏览 'net 时,我没有看到太多关于这个主题的处理。当然,Cassandra 中的串行处理元素必须限制随着 N 增加而获得的速度。关于这个主题的任何想法、指示或链接将不胜感激。

编辑以提供视角:
我正在开展一个项目,该项目当前要求拥有 1,000 多个节点的 Cassandra 基础设施。我没有想出这个规范。我发现自己建议将 N 减少到 200 到 500 之间的范围,每个节点的串行计算速度至少是其两倍。通过对服务器配置进行简单的更改,这很容易实现,而不会造成每个节点的成本损失。

最佳答案

更好地描述了 Cassandra 的缩放比例Gustafson's law , 而不是 Amdahl's law .古斯塔夫森缩放看着 还有多少数据您可以随着节点数量的增加进行处理。也就是说,如果您有 N 倍的节点,则可以在相同的时间内处理 N 倍大的数据集。

这是可能的,因为 Cassandra 很少使用集群范围的协调,除了架构和环更改。大多数操作只涉及与复制因子相等的节点数,随着数据集的增长而保持不变——因此几乎线性扩展。

相比之下,Amdahl 缩放查看 多快随着节点数量的增加,您可以处理固定的数据集。也就是说,如果你有 N 倍的节点,你能以 N 倍的速度处理同一个数据集吗?

显然,在某些时候您会达到一个限制,即添加更多节点不会使您的请求更快,因为服务请求所需的时间最少。 Cassandra 在这里不是线性的。

就您而言,听起来您是在问拥有 1,000 个慢节点还是 200 个快速节点更好。你的数据集有多大?这取决于您的工作负载,但通常的建议是每个节点的最佳大小约为 1TB 数据,确保您有足够的 RAM 和 CPU 来匹配(请参阅 cassandra node limitations )。 1,000 听起来太多了,除非您拥有 PB 级数据。

关于cassandra - Cassandra 什么时候遇到阿姆达尔定律?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/8839436/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com