gpt4 book ai didi

indexing - 如何为ElasticSearch设置允许精确和全文搜索的字段映射?

转载 作者:行者123 更新时间:2023-12-02 22:20:40 27 4
gpt4 key购买 nike

这是我的问题:

我有一个名为product_id的字段,其格式类似于:

A+B-12321412

如果我使用标准的文本分析器,则将其拆分为 token ,如下所示:
/_analyze/?analyzer=standard&pretty=true" -d '                                        
A+B-1232412
'
{
"tokens" : [ {
"token" : "a",
"start_offset" : 1,
"end_offset" : 2,
"type" : "<ALPHANUM>",
"position" : 1
}, {
"token" : "b",
"start_offset" : 3,
"end_offset" : 4,
"type" : "<ALPHANUM>",
"position" : 2
}, {
"token" : "1232412",
"start_offset" : 5,
"end_offset" : 12,
"type" : "<NUM>",
"position" : 3
} ]
}

理想情况下,我有时会搜索确切的产品ID,而其他时候则使用子字符串,或者只是查询部分产品ID。

我对映射和分析器的理解是,每个字段只能指定一个分析器。

有没有一种方法可以将字段存储为已分析匹配和完全匹配?

最佳答案

是的,您可以使用fields参数。在您的情况下:

"product_id": {
"type": "string",
"fields": {
"raw": { "type": "string", "index": "not_analyzed" }
}
}

http://www.elasticsearch.org/guide/en/elasticsearch/reference/current/_multi_fields.html

这使您可以使用两个不同的定义对同一数据进行两次索引。在这种情况下,它将通过默认分析器和not_analyzed进行索引,它们只会获取完全匹配项。这对排序返回结果也很有用:

http://www.elasticsearch.org/guide/en/elasticsearch/guide/current/multi-fields.html

但是,您将需要花费一些时间来思考如何搜索。特别是,给定的零件号混合了字母,数字和标点符号或特殊字符,您可能需要发挥创意才能调整查询和匹配项。

关于indexing - 如何为ElasticSearch设置允许精确和全文搜索的字段映射?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/25069321/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com