Elasticsearch 不区分大小写的通配符搜索-6ren

Elasticsearch 不区分大小写的通配符搜索

转载作者：行者123 更新时间：2023-12-02 22:13:03

29

4

领域priorityName是 search_as_you_type数据类型。

我的用例就像我想用以下词搜索文档:---

“让我们”-> 应该给出两个结果

"DOING"-> 应该给出两个结果

“你是你吗”-> 应该给出两个结果

"Are You"-> 应该给出两个结果

“你做”(你做的不够)-> 应该给出两个结果

"re you"-> 应该给出两个结果

在 6 个中，只有前 5 个使用 multi_match 给了我想要的结果。
我怎么能有第 6 个用例，其中我们可以有不以第一个字符开头的不完整单词。

示例文档

        "_index": "priority",
        "_type": "_doc",
        "_id": "vaCI_HAB31AaC-t5TO9H",
        "_score": 1,
        "_source": { - 
          "priorityName": "What are you doing along Let's Go out"
        }
      },
      { - 
        "_index": "priority",
        "_type": "_doc",
        "_id": "vqCQ_HAB31AaC-t5wO8m",
        "_score": 1,
        "_source": { - 
          "priorityName": "what are you doing along let's go for shopping"
        }
      }
    ]
  }

最佳答案

上次搜索 re you ，您需要infix tokens默认情况下，它不包含在 search_as_you_type 数据类型中。我建议您创建一个自定义分析器，它将创建中缀标记并允许您匹配所有 6 个查询。
我已经创建了一个自定义分析器并使用您的示例文档对其进行了测试，所有 6 个查询都给出了两个示例结果。
索引映射
POST/中缀索引

{
    "settings": {
        "max_ngram_diff": 50,
        "analysis": {
            "filter": {
                "autocomplete_filter": {
                    "type": "ngram",
                    "min_gram": 1,
                    "max_gram": 8
                }
            },
            "analyzer": {
                "autocomplete_analyzer": {
                    "type": "custom",
                    "tokenizer": "whitespace",
                    "filter": [
                        "lowercase",
                        "autocomplete_filter"
                    ]
                },
                "lowercase_analyzer": {
                    "type": "custom",
                    "tokenizer": "whitespace",
                    "filter": [
                        "lowercase"
                    ]
                }
            }
        }
    },
    "mappings": {
        "properties": {
            "priorityName": {
                "type": "text",
                "analyzer": "autocomplete_analyzer",
                "search_analyzer": "standard" --> note this
            }
        }
    }
}

索引您的示例文档

{
  "priorityName" : "What are you doing along Let's Go out"
}

{
  "priorityName" : "what are you doing along let's go for shopping"
}

最后的搜索查询 re you

{
    "query": {
        "match" : {
            "priorityName" : "re you"
        }
    }
}

结果

"hits": [
      {
        "_index": "ngram",
        "_type": "_doc",
        "_id": "1",
        "_score": 1.4652853,
        "_source": {
          "priorityName": "What are you doing along Let's Go out"
        }
      },
      {
        "_index": "ngram",
        "_type": "_doc",
        "_id": "2",
        "_score": 1.4509768,
        "_source": {
          "priorityName": "what are you doing along let's go for shopping"
        }
      }

其他查询也向我返回了两个文件，但不包括它们以缩短此答案的长度。
注:下面是一些重要的链接，可以详细了解答案。
https://www.elastic.co/guide/en/elasticsearch/reference/current/search-analyzer.html
https://www.elastic.co/guide/en/elasticsearch/reference/current/analysis-ngram-tokenizer.html

关于Elasticsearch 不区分大小写的通配符搜索，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/60786805/

29

4

0

文章推荐： elasticsearch - Ballerina 集成器和 Elasticsearch

文章推荐：禁用对象中的 ElasticSearch 查询字段

mysql - (mySql)查询匹配/精确字符串/[通配符]/精确字符串/[通配符]等？
我的网址看起来像 '/api/comments/languages/124/component/segment_translation/2' 我知道 url 的哪些部分是静态的；并且是动态的 - 并且
Notepad++ 通配符
如何使用通配符查找和替换主域之后的所有字符(包括“/”字符)？例如，我有以下 4 行: intersport-schaeftlmaier.de/ weymouthhondapowersports.c
Jquery 通配符
我有 3 个控件，其 ID 为 control_1、control_2、control_3。我想隐藏这些控件。目前我正在使用这个: $('#control_1').hide(); $('#cont
MySQL如何LIKE匹配参数+通配符？
我有一个旧歌曲数据库，我想将其转移到新数据库。我的旧数据库看起来像这样，多个值被填充在一个用逗号分隔的字段中 SONG id | title | artist |
MySQL WHERE IN 通配符
首先，我知道downloads表没有标准化。我有这两个表: downloads map | author 1 | Nikola 2 | Nikola George 和 mappers mapper_
详解SQL 通配符
通配符可用于替代字符串中的任何其他字符。 SQL 通配符在 SQL 中，通配符与 SQL LIKE 操作符一起使用。 SQL 通配符用于搜索表中的数据。在 SQL 中，可使用以下通配符：
bash - 由引号和未引号部分组成的字符串中的通配符扩展(通配符)
我在 shell 脚本中有一行看起来像这样: java -jar "$dir/"*.jar ，因为我只想执行该文件夹中恰好命名的 jar 文件。但这并不像我预期的那样有效。我收到错误消息: Error
Powershell:Where-Object 通配符
我想在 Active Directory 用户的所有属性中搜索特定电话号码/分机号。我可以像这样获取所有属性: get-aduser joesmith -Properties * 但我想过滤结果，例
将文件名作为参数传递时的 powershell 通配符
我在运行 Python 3在 Windows 机器上使用 PowerShell .我正在尝试执行一个 Python 文件，然后使用通配符将多个文件(file1.html、file2.html 等)作为
javascript - getElementById() 通配符
我有一个 div，并且有一些处于未定义级别的子节点。现在我必须将每个元素的 ID 更改为一个 div。如何实现？我想，因为它们有向上的ID，所以如果父级是id='path_test_maindiv
Lua 比较运算符(通配符？)
我是 Lua 的新手，所以我现在正在学习运算符部分。在 Lua 中是否有与字符串一起使用的通配符？我有 PHP 背景，我实际上是在尝试编写以下代码: --scan the directory's f
java - 通配符，java中的通用
我在 countList 方法上遇到编译时错误。 public static void countList( List list, int count ){ for( int i =
Java、命名Bean、通配符？
我们需要在运行时检索多个类实例，而无需手动维护所有可用类型的列表。可能的方法: 检索带有@xy注释的每种类型的实例检索每种类型的实例实现接口(interface)iXY 检索每种类型的实例，命名如
用于完成字符串的 Prolog 通配符
我目前陷入了序言问题。到目前为止我有: film(Title) :- movie(Title,_,_).(其中“movie(T,_,_,)”是对我的引用数据库) namesearch(Title,
R gsub 通配符
我想从字符表达式(在 R 中)中删除一个“*”。在阅读帮助页面并尝试谷歌后，我无法充分理解 gsub 的复杂性。有人可以建议我该怎么做吗？谢谢，乔纳森。最佳答案您需要转义两次:一次针对 R，一
选择器中的 jQuery 通配符
在我的 DOM 中，我有一个动态生成对话框的表。 DOM 中的对话框将具有以下形式的 ID: id="page:form:0:dlg" id="page:form:1:dlg" id="page:fo
Java 泛型 - 通配符
我是 Java 新手，并且已经陷入这样一种情况，很明显我误解了它如何处理泛型，但是阅读教程和搜索 stackoverflow 并没有(至少到目前为止)让我清楚我怀疑我滥用了通配符。需要注意的是，我有
图像源中的 jQuery 通配符
我想使用 jQuery 更改单击时图像的 src 属性。这是 HTML: View 2 在 img src 中，我想将“a”替换为“b”，但我的问题是我想忽略它前面的“1”，因为它也可能看起来像这样
字段中的 Mysql 通配符
我有一个 mysql 数据库，我的表是: Name | passcode ---------------------- hi* | 1111 ------------------
特定数量字符的 C# 通配符
我想选择所有在星号所在位置具有确切 4 个“未知”字符的文档:(例如“****”可能是“2018”) foreach (string s in Directory.GetFiles(@"C:\User

首页

博学

6Ren·AI

商城

Elasticsearch 不区分大小写的通配符搜索