作者热门文章
- android - RelativeLayout 背景可绘制重叠内容
- android - 如何链接 cpufeatures lib 以获取 native android 库?
- java - OnItemClickListener 不起作用,但 OnLongItemClickListener 在自定义 ListView 中起作用
- java - Android 文件转字符串
来自 MongoDB 的背景,我们倾向于基于周将数据的摄取分成多个集合(其中包含相同类型的数据)。这完全取决于我们索引的性能。
考虑在 Cassandra 中对同一概念建模,是否值得做同样的事情并根据时间段创建多个表?所以也许每周一次。
是否有任何性能提升?
由于我对 Hadoop 集成的研究,我也问这个问题,我可能只想映射/减少特定几周内有值(value)的数据,而不是所有数据,据我所知,这是最好的方法隔离我们要映射的数据。
在此先感谢您对此的任何意见。
最佳答案
这不是必须的。但是,请务必注意,您不应在 Cassandra 中使用二级索引,您应该对数据进行建模以匹配您正在执行的查询。
如果您经常希望每周执行一次操作,您可能希望按周对数据进行分桶。即每个分区有1周的数据。 (一个分区可以包含多行)
您可能会发现观看几个月前拍摄的 Cassandra 介绍视频很有帮助:https://www.youtube.com/watch?v=W45Ysb9b6oE
关于hadoop - 在 Cassandra 中将一张大 table 分成多个小 table ?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/26338280/
假设一个非常大的数据库。一张有 9 亿条记录的表。 方法一: 表:帖子 +----------+-------------- +------------------+----------------+
我是一名优秀的程序员,十分优秀!