gpt4 book ai didi

elasticsearch completion suggester 产生重复的结果

转载 作者:行者123 更新时间:2023-11-29 02:48:44 26 4
gpt4 key购买 nike

最近我在使用 elasticsearch completion suggester,遇到了一些问题,它总是产生相似的结果。

假设我使用以下语句进行搜索:

    "my_suggestion": {
> "text": "ni",
> "completion": {
> "field": "my_name_for_sug"
> }
> }

并得到如下结果:

 "my_suggestion" : [ {
"text" : "ni",
"offset" : 0,
"length" : 2,
"options" : [ {
"text" : "Nine West",
"score" : 329.0
}, {
"text" : "Nine West ",
"score" : 329.0
}, {
"text" : "Nike",
"score" : 295.0
}, {
"text" : "NINE WEST",
"score" : 168.0
}, {
"text" : "NINE WEST ",
"score" : 168.0
} ]
} ],

所以问题是如何合并或聚合相同的结果,如“九西”和“九西”。

映射是:

    "my_name_for_sug": {
"type": "completion"
,"analyzer": "ik_max_word"
,"search_analyzer": "ik_max_word"
,"payloads": true
,"preserve_separators": false
}

其中 ik_max_word 是中文专用的分析器,它可以完成标准分析器的工作。

谢谢

最佳答案

Elastic Suggesters 会自动删除重复的相同输出(至少到 2.x 为止)。我还没有尝试过 5.x,那里的建议者有一些变化。问题似乎是您的索引分析器,它正在为您的文档编制索引,以便:

"text": "九西",
"text": "九西",
“文本”:“九西”,
“文本”:“九西”,
不完全一样。您需要使用分析器对它们进行索引,该分析器将标记小写,并去除多余的空格等。执行此操作后,您应该会根据需要获得经过去重的建议输出。

关于elasticsearch completion suggester 产生重复的结果,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/39182390/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com