elasticsearch - 具有过滤器的 Elasticsearch 聚合无法过滤聚合-6ren

elasticsearch - 具有过滤器的 Elasticsearch 聚合无法过滤聚合

转载作者：行者123 更新时间：2023-12-02 23:46:58

25

4

您好，我们正在研究一个项目，如果有人可以提供帮助，那么我们会陷入困境，那真的很棒

GET xyxz/_search
{
   "size":0,
   "aggs":{
      "company":{
         "terms":{
            "field":"skills.name.keyword",
            "size":10
         }
      }
   },
   "query":{
      "bool":{
         "must":[

         ],
         "filter":[

         ],
         "should":[
            {
               "wildcard":{
                  "skills.name":{
                     "value":"jav*"
                  }
               }
            }
         ],
         "must_not":[

         ]
      }
   }
}

新的更新查询

                    POST INDEX/_search
                    {
                        "size": 0,
                        "aggs": {
                            "my_terms": {
                                "terms": {
                                    "script": {
                                        "inline": """
                                if(doc['skills.name.keyword'].size()>0)
                                {                   
                                    if(doc['skills.name.keyword'].value.contains("jav"))
                                    {
                                      return doc['skills.name.keyword'];
                                    }
                                }
                              """
                                    },
                                    "size": 10
                                }
                            }
                        }
                    }

样本响应

            {
                "took" : 7469,
                "timed_out" : false,
                "_shards" : {
                    "total" : 1,
                    "successful" : 1,
                    "skipped" : 0,
                    "failed" : 0
                },
                "hits" : {
                    "total" : {
                        "value" : 10000,
                        "relation" : "gte"
                    },
                    "max_score" : null,
                    "hits" : [ ]
                },
                "aggregations" : {
                    "my_terms" : {
                        "doc_count_error_upper_bound" : 0,
                        "sum_other_doc_count" : 871,
                        "buckets" : [
                            {
                                "key" : "java",
                                "doc_count" : 121
                            },
                            {
                                "key" : "javascript",
                                "doc_count" : 77
                            },
                            {
                                "key" : "sql",
                                "doc_count" : 62
                            },
                            {
                                "key" : "core java",
                                "doc_count" : 46
                            },
                            {
                                "key" : "xml",
                                "doc_count" : 43
                            },
                            {
                                "key" : "software development",
                                "doc_count" : 36
                            },
                            {
                                "key" : "requirements analysis",
                                "doc_count" : 34
                            },
                            {
                                "key" : "microsoft sql server",
                                "doc_count" : 31
                            },
                            {
                                "key" : "java enterprise edition",
                                "doc_count" : 30
                            },
                            {
                                "key" : "jquery",
                                "doc_count" : 27
                            }
                        ]
                    }
                }
            }

信息 :
我要说非常感谢，感谢您的帮助，自从几周以来我们一直在通过堆栈溢出进行通信。
再次感谢堆栈溢出社区

最佳答案

解决方案:聚合结果:

发布收到您的映射后，下面是您在寻找我使用 Scripted Terms Aggregation 的地方:

POST <your_index_name>/_search
{
  "size": 0,
  "aggs": {
    "my_terms": {
      "terms": {
        "script": {
          "inline": """
            if(doc['skills.name.keyword'].size()>0){                    <---- Note this logic I've added 
                if(doc['skills.name.keyword'].value.contains("jav")){
                  return doc['skills.name.keyword'];
                }
            }
          """
        }, 
        "size": 10
      }
    }
  }
}

请注意，我已经为Java使用了 contains类的 String方法。您可以根据要查找的内容更改逻辑，以便仅过滤出想要的聚合值。

您可能必须过滤聚合响应的原因是由于您的示例文档可以具有以下示例所示的多种技能:

{
  "skills": [
    {
      "name": "java"
    },
    {
      "name": "javascript"
    },
    {
      "name": "c++"
    }
    ]
}

请注意，您的解决方案是 object数据类型。

查询结果将返回整个文档，然后聚合查询将在这些结果之上运行。

如您所见，上面的文档也有 c++，它也将包含在聚合查询中。实现 hits上聚合的唯一方法是利用我提到的脚本化逻辑。

自动竞争问题:

第二个问题是自动完成功能，为此您需要阅读一些有关它的信息，因为有多种方法可以实现它。

但是，我建议您首先了解Elasticsearch的 Analysis阶段，了解 Analyzer是什么以及组成Analyzer的各个部分，最后继续阅读 Edge n-grams tokenizer和 Completion Suggester。

掌握所有这些概念将花费一些时间，但是一旦掌握了这些概念，就可以轻松实现它。

请注意，我不建议使用通配符查询。了解并了解Ngram或Edge Ngram标记生成器后，您的查询就可以像 jav的简单匹配查询一样简单。但是请务必阅读链接中提到的概念。

让我知道这是否有帮助以及您是否需要进一步说明。

关于elasticsearch - 具有过滤器的 Elasticsearch 聚合无法过滤聚合，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/60588485/

25

4

0

文章推荐： asp.net - 如何确定生产ASP.NET网站是否正在运行调试版本？

文章推荐： powershell - 当通过管道传输文件时，Import-CSV返回null

elasticsearch - ElasticSearch:安装插件后，elasticsearch-head
我在这里有一个问题，我不知道这是否正常。但是我认为这里有些湖，安装插件elasticsearch-head之后，我在浏览器中启动url“http://localhost:9200/_plugin/h
elasticsearch - 如何添加到不同的字段值并将其存储在 Elasticsearch python中的另一个字段中( Elasticsearch 字段操作)
我写了这个 flex 搜索查询: es.search(index=['ind1'],doc_type=['doc']) 我得到以下结果: {'_shards': {'failed': 0, 'skip
elasticsearch - Elasticsearch.Net.ElasticSearch.Path已弃用，我应该改用什么？
在ElasticSearch.Net v.5中，存在一个属性 Elasticsearch.Net.RequestData.Path ，该属性在ElasticSearch.Net v.6中已成为depr
elasticsearch - 更改 elasticsearch.yml 后重新加载 elasticsearch
如何让 elasticsearch 应用新配置？我更改了文件 ~ES_HOME/config/elasticsearch.yml 中的一个字符串: # Disable HTTP completely:
elasticsearch - Elasticsearch 部分子串搜索
我正在尝试使用以下分析器在 elastic serach 7.1 中实现部分子字符串搜索 PUT my_index-001 { "settings": { "analysis": {
elasticsearch - elasticsearch 是如何处理不同任务的优先级的？
假设一个 elasticsearch 服务器在很短的时间内接收到 100 个任务。有些任务很短，有些任务很耗时，有些任务是删除任务，有些是插入和搜索查询。 elasticsearch 是如何决定先运行
elasticsearch - Elasticsearch 中的聚合日期范围过滤值
我需要根据日期过滤一组值(在此处添加字段)，然后按 device_id 对其进行分组。所以我正在使用以下东西: { "aggs":{ "dates_between":{ "fi
elasticsearch - 按星期几和时间过滤 Elasticsearch
我在 Elasticsearch 中有一个企业索引。索引中的每个文档代表一个业务，每个业务都有business_hours。我试图允许使用星期几和时间过滤营业时间。例如，我们希望能够进行过滤，以显示我
elasticsearch - Elasticsearch 类型过滤器中的多种类型
我有一个这样的过滤查询 query: { filtered: { query: { bool: { should: [{multi_match: {
elasticsearch - Elasticsearch 中的匹配短语查询中的单个单词是否有字符限制？
Elasticsearch 相当新，所以可能不得不忍受我，我遇到了一个问题，如果我使用 20 个字符或更少的字符搜索文档，文档会出现，但是查询中同一个单词中的任何更多字符，我没有结果: 使用“苯氧甲基
elasticsearch - ElasticSearch 中字符串数组与串联字符串的内部结构
我试图更好地理解 ElasticSearch 的内部结构，所以我想知道 ElasticSearch 在内部计算以下两种情况的术语统计信息的方式是否存在任何差异。第一种情况是当我有这样的文件时: {
elasticsearch - ElasticSearch 中现有字段的补全建议
在我的 elasticsearch 索引中，我索引了一堆工作。为简单起见，我们只说它们是一堆职位。当人们在我的搜索引擎中输入职位时，我想“自动完成”可能的匹配。我在这里调查了完成建议:http://
elasticsearch - Elasticsearch 中多字段和复制到的区别？
我在很多映射中使用多字段。在 Elastic Search 的文档中，指示应将多字段替换为“fields”参数。参见 http://www.elasticsearch.org/guide/en/ela
elasticsearch - Elasticsearch 中的过滤方面
我有如下查询， query = { "query": {"query_string": {"query": "%s" % q}}, "filter":{"ids
elasticsearch - Elasticsearch 日期范围聚合
我有一个Json数据 "hits": [ { "_index": "outboxprov1", "_type": "deleted-c
elasticsearch - Elasticsearch 中的大小参数
这可能是一个初学者的问题，但我对大小有一些疑问。根据 Elasticsearch 规范，大小的最大值可以是 10000，我想在下面验证我的理解: 示例查询: GET testindex-2016.0
elasticsearch - Elasticsearch 滚动行为
我在 Elastic Search 中发现了滚动功能，这看起来非常有趣。看了那么多文档，下面的问题我还是不清楚。如果偏移量已经存在那么为什么要使用滚动？即将到来的记录呢？假设它完成了所有数据的滚动
elasticsearch - Elasticsearch 不区分大小写
我有以下基于注释的 Elasticsearch 配置，我已将索引设置为不被分析，因为我不希望这些字段被标记化: @Document(indexName = "abc", type = "efg
elasticsearch - elasticsearch:单个索引中的多种类型
我正在尝试在单个索引中创建多个类型。例如，我试图在host索引中创建两种类型(post，ytb)，以便在它们之间创建父子关系。 PUT /ytb { "mappings": { "po
elasticsearch - ElasticSearch 中的动态模板失败
我尝试创建一个简单的模板，包括一些动态模板，但我似乎无法为文档编制索引。我得到错误: 400 {"error":"MapperParsingException[mapping [_default_]

首页

博学

6Ren·AI

商城

elasticsearch - 具有过滤器的 Elasticsearch 聚合无法过滤聚合