gpt4 book ai didi

Cassandra 架构设计的可行性

转载 作者:行者123 更新时间:2023-12-03 06:58:57 25 4
gpt4 key购买 nike

我正在为我的一个项目评估 cassandra,我有兴趣了解具有数百万列族和数百万行的基本 cassandra 架构设计的可行性。每行的上限为 30,000 列。对于分布式 cassandra 集群(5-10 个节点)来说,这是一个可行的设计,还是我遗漏了一些东西?

我也有兴趣了解在一个事务中从单行检索所有列的可行性。我想这样做的原因是在将它们返回给用户之前按它们的值对它们进行排序。

最佳答案

数百万个列族目前在 cassandra 中不可行。最近版本的上限约为数千。此外,您描述的数据集(百万个 cfs x 百万行)表明至少有 1 万亿行。当然,这取决于集群的具体情况,但这个行数/数据量将需要比 5-10 个节点大得多的集群。 Cassandra 使用大量中型节点比使用非常大且功能强大的节点要好得多。

关于一次检索所有列,默认最大请求大小为 15mb。这可以更改,但您几乎肯定不想更改它。您的查询很可能不应该接近最大请求,因为这样的大分配对 JVM 来说是困难的。有什么理由需要将其放在单个事务中吗?您可以在几个请求中轻松地翻阅一行,以获得所有列,然后在该点进行排序。

关于Cassandra 架构设计的可行性,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/10347858/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com