elasticsearch - 通过弹性获取具有唯一值(value)的所有文档-6ren

elasticsearch - 通过弹性获取具有唯一值(value)的所有文档

转载作者：行者123 更新时间：2023-12-03 00:00:31

25

4

例如:
我有很多这样的文件:

email status
1@123.com open
1@123.com click
2@123.com open
3@123.com open

由于记录“1@123.com”包含“点击”状态，因此我将查询具有唯一状态值:“打开”的所有文档，所以不要期望“1@123.com”!

我在下面尝试过，但是没有我的期望:

{
  "aggs": {
    "hard_bounce_count": {
      "filter": {
        "term": {
          "actionStatus": "open"
        }
      },
      "aggs": {
        "email_count": {
          "value_count": {
            "field": "email"
          }
        }
      }

我的预期回应是这样的:

2@123.com open
3@123.com open

我该怎么做，谢谢..

最佳答案

在这里，外部术语-ggs(名为 EMAIL_LIST )返回所有电子邮件，然后在每个电子邮件存储桶中，首先查找状态是否为打开(使用名称为 OPEN 的filter-ags)，然后查找状态是否为除了“打开”(使用另一个名为 OTHER_THAN_OPEN 的过滤器集)

{
   "size": 0,
   "aggs": {
      "EMAIL_LIST": {
         "terms": {
            "field": "email.keyword"
         },
         "aggs": {
            "OPEN": {
               "filter": {
                  "bool": {
                     "must": [
                        {
                           "term": {
                              "status": "open"
                           }
                        }
                     ]
                  }
               }
            },
            "OTHER_THAN_OPEN": {
               "filter": {
                  "bool": {
                     "must_not": [
                        {
                           "term": {
                              "status": "open"
                           }
                        }
                     ]
                  }
               }
            },
            "SELECTION_SCRIPT": {
               "bucket_selector": {
                  "buckets_path": {
                     "open_count": "OPEN._count",
                     "other_than_open_count": "OTHER_THAN_OPEN._count"
                  },
                  "script": "params.other_than_open_count==0 && params.open_count>0"
               }
            }
         }
      }
   }
}

在“bucket_selector”聚合上方，仅选择要输出的，仅具有打开状态的存储桶

 "aggregations": {
      "EMAIL_LIST": {
         "doc_count_error_upper_bound": 0,
         "sum_other_doc_count": 0,
         "buckets": [
            {
               "key": "2@123.com",
               "doc_count": 1,
               "OTHER_THAN_OPEN": {
                  "doc_count": 0
               },
               "OPEN": {
                  "doc_count": 1
               }
            },
            {
               "key": "3@123.com",
               "doc_count": 1,
               "OTHER_THAN_OPEN": {
                  "doc_count": 0
               },
               "OPEN": {
                  "doc_count": 1
               }
            }
         ]
      }
   }

因此最终答案将是电子邮件“2@123.com”和“3@123.com”

关于elasticsearch - 通过弹性获取具有唯一值(value)的所有文档，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/49399197/

25

4

0

文章推荐： ruby-on-rails - 在 chrome 中通过 Ruby on Rails 播放 MP3

文章推荐： javascript - Bootstrap 模式弹出窗口不会关闭

文章推荐： javascript - 如何在javascript中获取两个日期之间的秒数？

文章推荐： session - Powershell脚本杀死.exe终端服务器断开的 session

java - 弹性 beanstalk 上的 Tomcat : How to change server. 弹性 beanstalk 上的 xml 以禁用命令行参数的日志记录？
我在 AWS Elastic beanstalk 上有一个 tomcat 应用程序，建议 here我正在使用环境属性设置与数据库的 jdbc 连接，此参数包括数据库的用户和密码。问题是，tomcat
elasticsearch - 无法解析字段，弹性
经典的Elasticsearch不解析您的日期。也许我开始失明了。我不知道自己在做什么错，我的模板是: "datestamp": {
elasticsearch - 弹性-检查给定时间范围内的所有值是否都大于阈值X
我想使用 flex 查询在Kibana中创建警报。我正在使用opendistro警报功能。我想检查最近10分钟内cpu.pct字段的所有值是否大于50，如果是，则发出警报。 { "size": 500
elasticsearch - 弹性-选择前5个匹配后进行过滤
我正在使用Kibana中的警报功能，并且想检查字段的最后5个连续值是否超过阈值x，但是如果我在 flex 查询中使用过滤器，则会在前N个聚合之前应用该过滤器。有没有一种方法可以使用其他选择器或方法在
elasticsearch - 弹性-支持分页超过10000
我们的指数是超标准的。它是平坦的，并使用logstash从oracle / jdbc转储。我们也使用相当标准的查询语法来查询 flex : { "size": 20, "from"
elasticsearch - 弹性-多个过滤器查询语法
您好，我正在执行以下查询: { "_source": [ "source1", "source2", "source3", "source4", ], "q
elasticsearch - 弹性:用不必要的词搜索
请告诉我正确的方向:) 我有一个任务:通过查询以 flex 搜索方式查找文档，其中可能包含不必要的单词。我将说明我的意思: 假设我有一些包含单词“ big red car ”的文档(现在它们在索引的
elasticsearch - 弹性，我可以将我自己的全局序号与无痛术语聚合脚本一起使用吗？
这是我的一份文件可能看起来像的 { "CC":{"colors":["Blue","Green","Yellow"]}, "CN":{"colors":["White"
elasticsearch - 弹性 - 是否可以更改嵌套聚合的范围？
语境弹性 6.0.0 我有以下结构: { "age": 24, "blood": 450, "iv": 700, "job": "boss", "damage": "cut,
elasticsearch - 弹性 - 防止更新文档
我可以使文档不可变吗？当文档提交到相同的 id 时，它们是否不会被重写？ POST "localhost:9200/index001/_doc/1" // First time it is creat
algorithm - 弹性/蛇线算法
我正在制作一个图形应用程序，我可以在其中通过拖动多段线的控制点来编辑多段线。但是，我想通过使其具有弹性来使其更易于使用；拖动控制点时，不是移动单个点，我希望也移动该点一定距离内的点，具体取决于“拉”控
云服务器的“弹性”体现在哪些方面？
我们都知道云计算拥有弹性扩展的特性，所谓的弹性，即云端的可用资源能够随着用户的需求而灵活变化、自由升降，在业务高峰或低谷期，均能匹配适量的资源，既不捉襟见肘、也不过分浪费。弹性云服务器，简单地说，
elasticsearch - 弹性:匹配一个数组成员中的所有 token
我有一个索引，其中多个人可以通过他们的姓名+角色分配给一个文档。到目前为止，我们通过将“人员”添加为嵌套文档并仅将所有相关人员索引到一个文档中来实现搜索。我们对查询性能不满意，我想尝试从 "peo
elasticsearch - 弹性-批量上传:索引x更新
我要执行2个不同的批量上传，每次上传的顺序都是完全无法预测的在一次加载中，我将具有以下字段:SERVER_NAME，OS和PROD_1_VERSION在另一项中，我将具有以下字段:SERVER_NA
elasticsearch - 弹性:如何搜索嵌套字段？ [不工作]
如果我有一个索引到Elasticsearch的JSON文档，如下所示: "_source": { "pid_no": 19321, "aggregator_id
elasticsearch - 未知的BaseAggregationBuilder [bucket_sort]-弹性
我似乎无法按顺序排列 flex 查询的结果。我将内存利用率统计信息存储在elasticsearch中。文档示例如下所示: { "Component": "ABC", "memUsage"
elasticsearch - 弹性 token 生成器集成到所有可能的单词组合中
给定输入“快速的棕色狐狸跳”，我想为单词创建每种可能的 token 组合。因此，示例字符串将被标记为 [ "quick", "quick brown", "quick fox", "quick jum
elasticsearch - 弹性 bool 查询必须匹配不被考虑
我基本上是在尝试编写一个查询，它应该在哪里返回文档学校是“神圣的国际”，成绩是“第二”。但当前查询的问题在于它没有考虑必须匹配查询部分。即，即使我没有指定学校给我这份文件，因为它不匹配。查询给了
elasticsearch - 弹性 Canvas 日期格式
我正在尝试在Kibana Canvas 中设置日期格式，因此我遵循了此文档: https://www.elastic.co/blog/kibana-canvas-data-table-and-debu
c - 弹性 "Unrecognized Error"
在用 Flex 编写 token 生成器时，我遇到了这个恼人的错误:“无法识别的规则” 我的代码是: /* Keywords */ TYPE int|double|bool|char L

首页

博学

6Ren·AI

商城

elasticsearch - 通过弹性获取具有唯一值(value)的所有文档