gpt4 book ai didi

autocomplete - Elasticsearch:查找子串匹配

转载 作者:行者123 更新时间:2023-11-29 02:42:58 26 4
gpt4 key购买 nike

我想执行完全单词匹配和部分单词/子字符串匹配。例如,如果我搜索“男士 Razor ”,那么我应该能够在结果中找到“男士 Razor ”。但如果我搜索“en's shaver”,那么我也应该能够在结果中找到“men's shaver”。我使用以下设置和映射:

索引设置:

PUT /my_index
{
"settings": {
"number_of_shards": 1,
"analysis": {
"filter": {
"autocomplete_filter": {
"type": "edge_ngram",
"min_gram": 1,
"max_gram": 20
}
},
"analyzer": {
"autocomplete": {
"type": "custom",
"tokenizer": "standard",
"filter": [
"lowercase",
"autocomplete_filter"
]
}
}
}
}
}

映射:

PUT /my_index/my_type/_mapping
{
"my_type": {
"properties": {
"name": {
"type": "string",
"index_analyzer": "autocomplete",
"search_analyzer": "standard"
}
}
}
}

插入记录:

POST /my_index/my_type/_bulk
{ "index": { "_id": 1 }}
{ "name": "men's shaver" }
{ "index": { "_id": 2 }}
{ "name": "women's shaver" }

查询:

<强>1。通过精确词组匹配搜索 --> "men's"

POST /my_index/my_type/_search
{
"query": {
"match": {
"name": "men's"
}
}
}

上述查询在返回结果中返回“男士 Razor ”。

<强>2。按部分词匹配搜索 --> "en's"

POST /my_index/my_type/_search
{
"query": {
"match": {
"name": "en's"
}
}
}

以上查询不返回任何内容。

我也试过以下查询

POST /my_index/my_type/_search
{
"query": {
"wildcard": {
"name": {
"value": "%en's%"
}
}
}
}

仍然没有得到任何东西。我认为这是因为索引上的“edge_ngram”类型过滤器无法找到“部分单词/sbusting 匹配”。我也尝试了“n-gram”类型的过滤器,但它大大减慢了搜索速度。

请建议我如何使用相同的索引设置实现完全短语匹配和部分短语匹配。

最佳答案

要搜索部分字段匹配和完全匹配,如果您将字段定义为“未分析”或关键字(而不是文本),然后使用通配符查询,效果会更好。

See also this .

要使用通配符查询,请在要搜索的字符串的两端附加 *:

POST /my_index/my_type/_search
{
"query": {
"wildcard": {
"name": {
"value": "*en's*"
}
}
}
}

要使用不区分大小写,请使用带有小写过滤器和关键字分词器的自定义分析器。

自定义分析器:

"custom_analyzer": {
"tokenizer": "keyword",
"filter": ["lowercase"]
}

将搜索字符串设为小写

如果您得到的搜索字符串为 AsD:将其更改为 *asd*

关于autocomplete - Elasticsearch:查找子串匹配,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/23243867/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com