gpt4 book ai didi

hadoop - 在 Cassandra 中将一张大 table 分成多个小 table ?

转载 作者:可可西里 更新时间:2023-11-01 15:35:29 26 4
gpt4 key购买 nike

来自 MongoDB 的背景,我们倾向于基于周将数据的摄取分成多个集合(其中包含相同类型的数据)。这完全取决于我们索引的性能。

考虑在 Cassandra 中对同一概念建模,是否值得做同样的事情并根据时间段创建多个表?所以也许每周一次。

是否有任何性能提升?

由于我对 Hadoop 集成的研究,我也问这个问题,我可能只想映射/减少特定几周内有值(value)的数据,而不是所有数据,据我所知,这是最好的方法隔离我们要映射的数据。

在此先感谢您对此的任何意见。

最佳答案

这不是必须的。但是,请务必注意,您不应在 Cassandra 中使用二级索引,您应该对数据进行建模以匹配您正在执行的查询。

如果您经常希望每周执行一次操作,您可能希望按周对数据进行分桶。即每个分区有1周的数据。 (一个分区可以包含多行)

您可能会发现观看几个月前拍摄的 Cassandra 介绍视频很有帮助:https://www.youtube.com/watch?v=W45Ysb9b6oE

关于hadoop - 在 Cassandra 中将一张大 table 分成多个小 table ?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/26338280/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com