gpt4 book ai didi

elasticsearch - 在 Elasticsearch 中获取值的百分比

转载 作者:行者123 更新时间:2023-11-29 02:55:40 26 4
gpt4 key购买 nike

我有一些测试文档看起来像

"hits": {
...
"_source": {
"student": "DTWjkg",
"name": "My Name",
"grade": "A"
...
"student": "ggddee",
"name": "My Name2",
"grade": "B"
...
"student": "ggddee",
"name": "My Name3",
"grade": "A"

我想获得成绩为 B 的学生所占的百分比,假设只有 3 名学生,结果将是“33%”。

我如何在 Elasticsearch 中执行此操作?

到目前为止,我有这个聚合,我觉得它很接近:

"aggs": {
"gradeBPercent": {
"terms": {
"field" : "grade",
"script" : "_value == 'B'"
}
}
}

返回:

"aggregations": {
"gradeBPercent": {
"doc_count_error_upper_bound": 0,
"sum_other_doc_count": 0,
"buckets": [
{
"key": "false",
"doc_count": 2
},
{
"key": "true",
"doc_count": 1
}
]
}
}

我不一定要寻找确切的答案,也许是我可以搜索的术语和关键字。我已经阅读了 elasticsearch 文档,但没有找到任何有用的信息。

最佳答案

首先,您不需要用于此聚合的脚本。如果您想将结果限制为 `value == 'B' 的每个人,那么您应该使用过滤器而不是脚本来做到这一点。

ElasticSearch 不会准确返回百分比,但您可以使用TERMS AGGREGATION 的结果轻松计算出该百分比。

示例:

GET devdev/audittrail/_search
{
"size": 0,
"aggs": {
"a1": {
"terms": {
"field": "uIDRequestID"
}
}
}
}

返回:

{
"took": 12,
"timed_out": false,
"_shards": {
"total": 5,
"successful": 5,
"failed": 0
},
"hits": {
"total": 25083,
"max_score": 0,
"hits": []
},
"aggregations": {
"a1": {
"doc_count_error_upper_bound": 9,
"sum_other_doc_count": 1300,
"buckets": [
{
"key": 556,
"doc_count": 34
},
{
"key": 393,
"doc_count": 28
},
{
"key": 528,
"doc_count": 15
}
]
}
}
}

那么返回值是什么意思?

  • hits.total 字段是与您的查询匹配的记录总数。
  • doc_count 告诉您每个桶中有多少项目。

所以对于我这里的例子:我可以说键“556”出现在 25083 个文档中的 34 个中,所以它的百分比是 (34/25083) * 100

关于elasticsearch - 在 Elasticsearch 中获取值的百分比,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/35639240/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com