- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我有一个包含 user_id、amount 和 category 字段的索引交易。
我想计算每个用户和类别的平均金额,然后以获取每个类别的总平均金额结束。
SQL 看起来像这样:
SELET AVG(average), category from
(SELECT user_id, category, AVG(amount) AS average FROM transactions WHERE amount < 100000
GROUP BY user_id, category) AS a1
GROUP BY category
{
"aggs": {
"group_by_users": {
"terms": {
"field": "user_id.keyword"
},
"aggs": {
"group_by_category": {
"terms": {
"field": "category.keyword"
},
"aggs": {
"average_amount": {
"avg": {
"field": "amount"
}
}
}
}
}
}
}
}
-----------------------------------------
| user_id | category | amount |
-----------------------------------------
| 1 | insurances | 1000 |
| 1 | transport | 50 |
| 1 | transport | 100 |
| 2 | insurances | 700 |
| 2 | insurances | 200 |
| 2 | transport | 300 |
-----------------------------------------
-----------------------------------------
| user_id | category | average |
-----------------------------------------
| 1 | insurances | 1000 |
| 1 | transport | 75 |
| 2 | insurances | 450 |
| 2 | transport | 300 |
-----------------------------------------
-----------------------------
| category | average |
-----------------------------
| insurances | 725 |
| transport | 187,5 |
-----------------------------
最佳答案
avg_bucket
pipeline aggregation在某些情况下会完成这项工作(但可能无法随着索引的大小很好地扩展,请参阅下面的注释):
POST myindex1/_search
{
"size": 0,
"aggs": {
"by category": {
"terms": {
"field": "category.keyword"
},
"aggs": {
"by user_id": {
"terms": {
"field": "user_id"
},
"aggs": {
"avg by user": {
"avg": {
"field": "amount"
}
}
}
},
"average by user, category": {
"avg_bucket": {
"buckets_path": "by user_id>avg by user"
}
}
}
}
}
}
{
...
"aggregations" : {
"by category" : {
"doc_count_error_upper_bound" : 0,
"sum_other_doc_count" : 0,
"buckets" : [
{
"key" : "insurances",
"doc_count" : 3,
"by user_id" : {
"doc_count_error_upper_bound" : 0,
"sum_other_doc_count" : 0,
"buckets" : [
{
"key" : 2,
"doc_count" : 2,
"avg by user" : {
"value" : 450.0
}
},
{
"key" : 1,
"doc_count" : 1,
"avg by user" : {
"value" : 1000.0
}
}
]
},
"average by user, category" : {
"value" : 725.0 <--- average for `insurances`
}
},
{
"key" : "transport",
"doc_count" : 3,
"by user_id" : {
"doc_count_error_upper_bound" : 0,
"sum_other_doc_count" : 0,
"buckets" : [
{
"key" : 1,
"doc_count" : 2,
"avg by user" : {
"value" : 75.0
}
},
{
"key" : 2,
"doc_count" : 1,
"avg by user" : {
"value" : 300.0
}
}
]
},
"average by user, category" : {
"value" : 187.5 <--- average for `transport`
}
}
]
}
}
}
"by user_id"
开始
terms
聚合:我们要求 Elasticsearch 按
user_id
对文档进行分组并计算
amount
的平均值使用
avg
聚合。
POST myindex1/_search
{
"size": 0,
"aggs": {
"by user_id": {
"terms": {
"field": "user_id"
},
"aggs": {
"avg by user": {
"avg": {
"field": "amount"
}
}
}
}
}
}
SELECT user_id, avg(amount)
FROM my_index
GROUP BY user_id;
terms
聚合
"by category"
顶部
"by user id"
一。现在
avg
还将考虑以下类别:
POST myindex1/_search
{
"size": 0,
"aggs": {
"by category": {
"terms": {
"field": "category.keyword"
},
"aggs": {
"by user_id": {
"terms": {
"field": "user_id"
},
"aggs": {
"avg by user": {
"avg": {
"field": "amount"
}
}
}
}
}
}
}
}
SELECT user_id, category, avg(amount)
FROM my_index
GROUP BY user_id, category;
category
上聚合吗?再次?
avg_bucket
来完成管道聚合。唯一缺少的是告诉
avg_bucket
聚合在哪里确切地找到要聚合的桶,这是通过
buckets_path
完成的表达。
Pipeline aggregations work on the outputs produced from other aggregations rather than from document sets, adding information to the output tree.
user_id
在指数中,我们的平均值不会很精确。
terms
聚合仅返回
top 10 buckets , 和 SQL-ish 等价物应该如下所示:
SELECT category, avg(avg_amount)
FROM (
SELECT user_id, category, avg(amount) avg_amount
FROM my_index
GROUP BY user_id, category
LIMIT 10 per user_id
) Q
LIMIT 10;
size
更改此限制
terms
的参数聚合。
terms
返回
approximate document counts ,这也会影响平均值。
关于elasticsearch - 使用 Elasticsearch 进行总和/平均的子聚合,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/59252866/
我基本上有三个表: hunt_c_usershunt_c_collected_eggshunt_c_achievements 我目前只使用 hunt_c_users 和 hunt_c_collecte
我已经计算了不同表中计数的总和。这会执行两次,每个 performanceID 一次。现在我想得到两个总和的总和。 下面是我目前做的两个总和的代码: SELECT SUM((COUNT (Bo
我有一个对 2 个值求和的脚本。我计划添加更多值(value),但首先我需要让它发挥作用。人们告诉我给他们 NUMBER 值,所以我这样做了,但现在它甚至没有给出输出。 base = 0; $("#F
我正在尝试计算在我们的数据库中跟踪的花费总额。每个订单文档包含一个字段“total_price” 我正在尝试使用以下代码: db.orders.aggregate({ $group: {
给定 Excel 2013(或更高版本)中的 2 个命名表: tbl发票 ID InvRef Total 1 I/123 45 2 I/234
希望你们一切都好。我来这里是因为我从今天早上开始就试图解决一个问题,我再也受不了了。 这就是上下文:我有一个 excel 工作簿,其中有不同的工作表,其中包含不同国家/地区的不同商业计划。我的目标是制
我有一份报告显示客户订购的产品及其价格: CompanyA Product 7 14.99 CompanyA Product 3 45.95 CompanyA Prod
我使用此python客户端: https://github.com/ryananguiano/python-redis-timeseries 如何汇总所有匹配? ts = TimeSeries(cli
希望创建一个总和和计数公式,该公式将自动调整以适应范围内插入的新行。 例如,如果我在单元格 D55 中有公式 =SUM(D17:D54)。每次我在该范围内插入新行时,我都需要更改公式的顶部范围来解释它
所以,我需要聚合日期相同的行。 到目前为止,我的代码返回以下内容: date value source 0 2018-04-08 15:52:26.1
我有数字输入 数量约为 30 我需要将它们全部汇总到一个字段 我拥有的在下面 查看:
您好,我正在尝试根据以下数据计算过去三个月中出现不止一次的不同帐户 ID 的数量;我想要 2 作为查询结果,因为 test1@gmail.com 和 test2@gmail.com 出现超过 1 次。
我有两个带有以下字段的表: ... orders.orderID orders.orderValue 和 payments.orderID payments.payVal 在 payments.pay
我想按 image_gallery 和 video_gallery 两列的 DESC 进行排序。 SELECT b.*, c.title as category, (S
实际上我的原始数据库为 SELECT sum(data1,data2) as database_value,sum(data3,data4) as database_not_value from t
我试图获取三个分数中每一个的值并将它们相加并显示在“总计:”中。我的问题是,我不知道如何做到这一点,以便每次其中一个分数值发生变化时,相应的总分值也会随之变化。 我可以在某处调用“onchange”来
如何获得按第一个值分组的元组列表中第二个和第三个值的总和? 即: list_of_tuples = [(1, 3, 1), (1, 2, 4), (2, 1, 0), (2, 2, 0)] expec
我正在尝试将我的列表中的整数转换为列表的总和和平均值,并说明任何低于冰点 F<32 的温度。每当我尝试获取总和或平均值时,我都会收到错误提示“+: 'int' 和 'str' 不支持的操作数类型”。我
在我的 ios 项目中,我使用了两个实体 (CoreData):具有一对多关系的 Person 和 Gifts 我知道如何计算给一个人的礼物总和: NSDecimalNumber *orderSum=
我有两个表(输入和类别): CREATE TABLE categories ( iId INTEGER NOT NULL PRIMARY KEY AUTOINCREMENT, sNam
我是一名优秀的程序员,十分优秀!