gpt4 book ai didi

mysql - NOSQL 数据库的聚合和统计功能

转载 作者:行者123 更新时间:2023-11-29 04:45:15 27 4
gpt4 key购买 nike

使用 SQL 数据库,可以轻松执行协方差、标准差、峰度、偏度、偏差、均值和中位数、求和和乘积等统计/聚合函数,而无需将数据取出到应用程序服务器。 http://www.xarg.org/2012/07/statistical-functions-in-mysql/

How are such computations done effectively (as close as possible to the store, assuming map/reduce "jobs" won't be realtime) on NoSql databases in general and dynamodb(cassandra) in particular, for large datasets.

AWS RDS(MySQL、PostgresSQL 等)好吧,不是 NoSQL,而 Amazon Redshift (ParAccel) - 一种列式存储 - 具有 SQL 接口(interface),可能有点矫枉过正(6.85 美元/小时)。 Redshift 的聚合功能有限(http://docs.aws.amazon.com/redshift/latest/dg/c_Aggregate_Functions.htmlhttp://docs.aws.amazon.com/redshift/latest/dg/c_Window_functions.html)

最佳答案

对于没有聚合功能的数据库(例如 Cassandra),您总是需要提取一些数据。在您的数据库附近构建分布式计算集群是目前流行的选择(使用诸如 Storm 之类的项目)。这样您就可以并行请求和处理数据来执行您的操作。将其视为“实时”Hadoop(尽管它并不相同)。

实现这样的设置显然比开箱即用的系统更复杂,因此请将其纳入您的决定。好处是,如果需要,集群允许您以超出传统数据库解决方案支持的任何方式执行复杂的自定义分析。

关于mysql - NOSQL 数据库的聚合和统计功能,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/20016300/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com