gpt4 book ai didi

elasticsearch - Elasticsearch使用截止值计算Max

转载 作者:行者123 更新时间:2023-12-03 01:44:27 26 4
gpt4 key购买 nike

这是一个奇怪的要求。

我们需要在数据集中计算一个 MAX 值,但是,我们的某些数据是 BAD ,这意味着 MAX 值会产生不良结果。

说字段“myField”中的值是:

输入:

10 30 20 40 1000000



当前输出:

1000000



期望的输出:

40


{"aggs": {
"aggs": {
"maximum": {
"max": {
"field": "myField"
}
}
}
}
}

我曾考虑过对数据进行排序,但是由于实际数据要达到100K +,所以这确实会很慢。

所以我的问题是,有没有一种方法可以截断 aggs 中的数据,从而忽略实际的 MAX并返回 SECOND MAX,或者忽略顶部 10%并返回最大值。

最佳答案

您是否考虑过使用百分位数消除异常值?也许先运行百分位数聚合,然后将其用作范围过滤器的基础?

需求对我来说似乎有点模糊,因此这只是另一种尝试,无法确定这是否是您所追求的。

关于elasticsearch - Elasticsearch使用截止值计算Max,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/45161287/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com