elasticsearch - Elasticsearch索引搜索货币美元和英镑符号-6ren

elasticsearch - Elasticsearch索引搜索货币美元和英镑符号

转载作者：行者123 更新时间：2023-12-02 22:24:04

24

4

在我的某些文档中，我使用$或£符号。我想搜索£并检索包含该符号的文档。我经历了the documentation，但出现了一些认知失调。

# Delete the `my_index` index
DELETE /my_index    

# Create a custom analyzer
PUT /my_index
{
  "settings": {
    "analysis": {
      "char_filter": {
        "&_to_and": {
          "type": "mapping",
          "mappings": [
            "&=> and ",
            "$=> dollar "
          ]
        }
      },
      "analyzer": {
        "my_analyzer": {
          "type": "custom",
          "char_filter": [
            "html_strip",
            "&_to_and"
          ],
          "tokenizer": "standard",
          "filter": [
            "lowercase"
          ]
        }
      }
    }
  }
}

就像文档指出的那样，这将返回“the”，“quick”，“and”，“brown”，“fox”:

# Test out the new analyzer
GET /my_index/_analyze?analyzer=my_analyzer&text=The%20quick%20%26%20brown%20fox

这将返回“the”，“quick”，“dollar”，“brown”，“fox”

GET /my_index/_analyze?analyzer=my_analyzer&text=The%20quick%20%24%20brown%20fox

添加一些记录:

PUT /my_index/test/1
{
  "title": "The quick & fast fox"
}    

PUT /my_index/test/1
{
  "title": "The daft fox owes me $100"
}

我本以为如果搜索“美元”，我会得到结果吗？相反，我没有任何结果:

GET /my_index/test/_search
{ "query": {
    "simple_query_string": {
      "query": "dollar"
    }
  }
}

甚至在分析器上使用“$”:

GET /my_index/test/_search
{ "query": {
  "query_string": {
    "query": "dollar10",
    "analyzer": "my_analyzer"
  }
 }
}

最佳答案

您的问题是您指定了自定义分析器，但从未使用过。如果使用term vertors，则可以验证。因此，请按照以下步骤操作:

在为标题字段创建自定义分析器并为其设置索引时:

GET /my_index

{
  "settings": {
    "analysis": {
      "char_filter": {
        "&_to_and": {
          "type": "mapping",
          "mappings": [
            "&=> and ",
            "$=> dollar "
          ]
        }
      },
      "analyzer": {
        "my_analyzer": {
          "type": "custom",
          "char_filter": [
            "html_strip",
            "&_to_and"
          ],
          "tokenizer": "standard",
          "filter": [
            "lowercase"
          ]
        }
      }
    }
  }, "mappings" :{
    "test" : {
      "properties" : {
        "title" : {
          "type":"string",
          "analyzer":"my_analyzer"
        }
      }
    }
  }
}

插入数据:

PUT my_index/test/1

{
  "title": "The daft fox owes me $100"
}

检查术语 vector :

GET /my_index/test/1/_termvectors?fields=title

响应:

{
   "_index":"my_index",
   "_type":"test",
   "_id":"1",
   "_version":1,
   "found":true,
   "took":3,
   "term_vectors":{
      "title":{
         "field_statistics":{
            "sum_doc_freq":6,
            "doc_count":1,
            "sum_ttf":6
         },
         "terms":{
            "daft":{
               "term_freq":1,
               "tokens":[
                  {
                     "position":1,
                     "start_offset":4,
                     "end_offset":8
                  }
               ]
            },
            "dollar100":{       <-- You can see it here
               "term_freq":1,
               "tokens":[
                  {
                     "position":5,
                     "start_offset":21,
                     "end_offset":25
                  }
               ]
            },
            "fox":{
               "term_freq":1,
               "tokens":[
                  {
                     "position":2,
                     "start_offset":9,
                     "end_offset":12
                  }
               ]
            },
            "me":{
               "term_freq":1,
               "tokens":[
                  {
                     "position":4,
                     "start_offset":18,
                     "end_offset":20
                  }
               ]
            },
            "owes":{
               "term_freq":1,
               "tokens":[
                  {
                     "position":3,
                     "start_offset":13,
                     "end_offset":17
                  }
               ]
            },
            "the":{
               "term_freq":1,
               "tokens":[
                  {
                     "position":0,
                     "start_offset":0,
                     "end_offset":3
                  }
               ]
            }
         }
      }
   }
}

现在搜索:

GET /my_index/test/_search

{
  "query": {
    "match": {
      "title": "dollar100"
    }
  }
}

那会找到匹配的。但是使用查询字符串搜索为:

GET /my_index/test/_search

{ "query": {
    "simple_query_string": {
      "query": "dollar100"
    }
  }
}

什么也找不到。因为它搜索特殊的_all字段。如我所见，由于未分析字段，因此会聚合字段:

GET /my_index/test/_search

{
  "query": {
    "match": {
      "_all": "dollar100"
    }
  }
}

找不到结果。但:

GET /my_index/test/_search

{
  "query": {
    "match": {
      "_all": "$100"
    }
  }
}

发现。我不确定，但原因可能是默认分析器不是自定义分析器。要将自定义分析器设置为默认检查:

Changing the default analyzer in ElasticSearch or LogStash

http://elasticsearch-users.115913.n3.nabble.com/How-we-can-change-Elasticsearch-default-analyzer-td4040411.html

http://grokbase.com/t/gg/elasticsearch/148kwsxzee/overriding-built-in-analyzer-and-set-it-as-default

http://elasticsearch-users.115913.n3.nabble.com/How-to-set-the-default-analyzer-td3935275.html

关于elasticsearch - Elasticsearch索引搜索货币美元和英镑符号，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/37075970/

24

4

0

文章推荐： powershell - 无法从文件/应用程序打开/读取本地数据

文章推荐： javascript - window.innerWidth window.outerWidth 和有什么区别？

文章推荐： windows - Install-Module 尝试使用错误的 url 下载包

python - 在字符串中找到左半部分的计数(符号)=右半部分的计数(符号)的索引？
给定一个字符串，例如 s="##$$$#"，我如何找到索引之前的“#”符号数等于“”数的索引$"符号在索引之后？示例:如果 s="##$$$#"，则输出将为 2。解释:在索引 2 之前我们有 2
JavaScript 符号
在本教程中，您将借助示例了解 JavaScript 符号。 JavaScript 符号 JavaScript ES6 引入了一种新的原始数据类型，称为 Symbol（符号）。符号是不可变的（不能更改）
Haskell >.> 符号
在“函数编程的工艺”一书中，符号 '>.>' 将函数连接在一起，与 '.' 的方向相反。但是当我使用 ghci 实现它时，它显示了超出范围的错误 '>.>'。为什么？它是不再使用的旧符号吗？最佳答案
JavaScript $ 符号？
很难说出这里问的是什么。这个问题是含糊的、模糊的、不完整的、过于宽泛的或修辞性的，无法以目前的形式得到合理的回答。如需帮助澄清此问题以便重新打开它，visit the help center 。已关
从字符串中删除双引号\"符号
我需要从向量中删除 \"。这是我的数据: data <- c("\"https://click.linksynergy.com/link?id=RUxZriH*PWc&offerid=323058.1
正则表达式模式不支持 # 符号
我在 Nginx 配置中使用正则表达式来捕获文件 URL，但如果文件 URL 包含 # 符号，正则表达式模式将不会捕获它。这里是nginx的配置部分。 location ~ ^/p/(?[\w\-=
highcharts & 符号
如何使 & 符号在此图表的第一组条形/列下正确显示: http://jsfiddle.net/VxbrK/2/ 应该是“Apples & Oranges”而不是“Apples & Oranges”。
Verilog ** 符号
**在verilog中是什么意思？我为测试台提供了以下逻辑 localparam NUM_INPUT_BITS = 1; localparam NUM_OUTPUT_BITS
Java正则表达式电子邮件替换所有空格和 "[at]"符号
我有一个使用正则表达式来验证电子邮件地址的方法。 public String searchFormail(String searchWord) { Pattern pattern = Patt
Python正则表达式将字符串拆分为数字和文本/符号
我想将一个字符串拆分为数字部分和文本/符号部分我当前的代码不包含负数或小数，并且表现得很奇怪，在输出的末尾添加了一个空列表元素 import re mystring = 'AD%5(6ag 0.33-
javascript从数组中随机数返回单个字母/符号
我有一些代码需要从数组中选择一个随机字符串，但它一直返回单个字母或数字。如何解决这个问题？ var name = ["Yayek", "Vozarut", "Gezex",
Python 符号？
我刚开始使用 Python，我在考虑应该使用哪种表示法。我读过 PEP 8关于 Python 符号的指南，我同意那里的大多数内容，除了函数名称(我更喜欢混合大小写风格)。在 C++ 中，我使用匈牙利
C# 符号
在用 C# 编写代码时，我错误地在 if 语句中的变量前添加了一个符号(而不是感叹号)。 bool b = false; if (@b) { } 我很惊讶它编译成功，没有任何错误。我想知道:上面的代
IOS如何替换电话号码中间4位为＂-＂符号
本文实例为大家分享了特殊字符替换电话号码中某一部分的方法，ios利用-号替换电话号码中间四位，供大家参考，具体内容如下 1、效果图 2、代码 rootviewcontroll
Python sympy 符号
当我使用“x”和“z”作为符号时，这段代码没有问题: from sympy import * x, z = symbols('x z') y = -6*x**2 + 2*x*z**0.5 + 50*x
从文本中删除标点符号(符号 & 除外)
我需要从文本中删除标点符号: data <- "Type the command AT&W enter. in order to save the new protocol on modem;"
r - 如何在数字中添加$符号
我有几个数字是 numeric 类。下面的例子。 df = c(12974,12412,124124,124124,34543,4576547,32235) 现在我想在每个数字前添加 '$' 符号而不
传说中的 Highcharts 符号
我有一个 highcharts 图例，其中符号以不同的大小显示，因为它们在实际图表中的大小不同。不幸的是，当数据点的大小增加时，它们也会在图例中增加。无论数据点大小如何，我都希望图例符号保持相同的大小
r - 如何在R中输入+-符号
我需要使用包含平均值+-SD的标题。到目前为止，我只能得到以下信息: "Mean +- SD or N (%)" [1] "Mean +- SD or N (%)" 如何直接使用“+-”符号？您知道一
URL 和 & 符号
使用 XSLT 和 XPath 1.0，我有一个要转义的字符串以用于 URL，例如: one word & another 因此，描述元素的 text() 应该进行 URL 转义。我该怎么做

首页

博学

6Ren·AI

商城

elasticsearch - Elasticsearch索引搜索货币美元和英镑符号