gpt4 book ai didi

azure - cassandra数据复制理解

转载 作者:行者123 更新时间:2023-12-02 06:50:57 26 4
gpt4 key购买 nike

我正在 Azure 上使用 Cassandra 集群。我花了 1 个多星期的时间才完成设置并开始工作。它现在可以工作,但我认为我误解了 Cassandra 的 1 个概念,即数据如何存储?

我的印象是,每当我上传数据时,相同的数据将在所有机器上可用,即如果我上传 10 MB 文件和 4 个节点(2 个种子),所有 4 个节点将消耗 10MB。我想我的想法是错误的。

因为我刚刚创建了 4 个节点并上传了大约 (2 + 5 + 20 + 20 = 47 MB​​) 的数据(blob),但是当我检查状态时,我看到下面的内容

--  Address   Load       Tokens  Owns (effective)  Host ID                               Rack
UN 10.1.2.5 28.32 MB 256 47.5% xxxxxxxx-eb9a-46fb-8213-c7487074d9a8 rc1
UN 10.1.2.4 27.14 MB 256 51.3% xxxxxxxx-11ed-41c6-be8b-a912e54b1ccf rc1
UN 10.1.2.7 25.09 MB 256 50.1% xxxxxxxx-9e73-410a-b1bf-5bfd15138625 rc2
UN 10.1.2.6 23.32 MB 256 51.2% xxxxxxxx-d132-49b6-8eda-4459391d12e4 rc2

顺便说一句,表的复制因子是“2”。负载每隔几分钟就会略有变化。但我可以下载数据并且它符合预期!

抱歉,我的懒惰和不公平,我已经用谷歌搜索设置一周了,如果您能帮助我理解这一点或至少向我指出正确的链接,我将非常感激。

谢谢,尼纳德

最佳答案

这看起来是预期的结果。根据您的复制因子,您的每条数据都会被复制 2 次。因此,分布在 4 个节点上的 47 Mb 乘以 2 大约会导致每个节点上大约 25 mb。

关于azure - cassandra数据复制理解,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/28340620/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com