gpt4 book ai didi

mongodb - 选择哪个数据库(Cassandra、MongoDB、?)来存储和查询事件/日志/指标数据?

转载 作者:IT老高 更新时间:2023-10-28 13:14:56 25 4
gpt4 key购买 nike

在 sql 术语中,我们是这样存储数据的:

table events (
id
timestamp
dimension1
dimension2
dimension3
etc.
)

所有维度值都是整数。这张表变得非常大。

我们希望对这样的查询进行快速读取:

SELECT dimension1, dimension2, COUNT(*) 
FROM events
WHERE dimension8 = 'foo'
AND dimension9 = 'bar'
GROUP BY 1, 2

我们想要快速写入,而不关心事务和一致性。我们关心最终的可用性和分区容错性。

我正在寻找“NoSQL”替代方案。 Casandra 可以做我正在寻找的那种查询吗?这在阅读他们的文档时并不是很明显......如果可以做到这一点,那么这些类型的查询的性能如何?

我也在研究 MongoDB,但据我所知,他们的“group()”函数有严重的限制(最多 10,000 行)。

您是否有使用这些数据库的经验,您会推荐它作为上述问题的解决方案吗?

我应该考虑哪些其他数据库可以快速执行此类查询?

干杯,吉米

最佳答案

“Group by”和“stupidly fast”不能同时使用。那只是那头野兽的本性……因此,Mongo的团体操作受到了限制; Cassandra 甚至本身不支持它(尽管它支持通过 Hadoop 进行 Hive 或 Pig 查询......但这些并不是为了愚蠢地快速)。

像 Twitter 的 Rainbird(使用 Cassandra)这样的系统通过非规范化/预计算计数来进行实时分析:http://www.slideshare.net/kevinweil/rainbird-realtime-analytics-at-twitter-strata-2011

关于mongodb - 选择哪个数据库(Cassandra、MongoDB、?)来存储和查询事件/日志/指标数据?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/5594458/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com