gpt4 book ai didi

elasticsearch - more_like_this不适用于字段中重复的相同文本

转载 作者:行者123 更新时间:2023-12-02 23:18:48 28 4
gpt4 key购买 nike

我们正在使用elasticsearch 6.0在elasticsearch索引中查找相似的组件。我们正在为此使用 more_like_this 。字段中重复的文本未得到正确的结果

1)第一个组件字段具有如下文本:

fan fan fan in the room



2)第二个组件字段具有如下文本:

one two three fan fan fan in the room.



当我尝试找出类似第一组件的组件时,elk没有显示任何结果。

我如何获得Elasticsearch结果,该结果将适用于重复的文本以及该字段中的唯一单词。

注意:-我们将无法添加min_term_freq。

最佳答案

默认情况下,min_doc_freq为5,因此您的查询不起作用,因为您的索引中至少包含5个term属性为黄色的文档。因此,在查询中将min_doc_freq设置为1即可使用。

{
"query": {
"more_like_this": {
"like": "Hello",
"min_term_freq": 1,
"min_doc_freq": 1
}
}
}

供引用,我们可以去 Elasticsearch More Like this no result

关于elasticsearch - more_like_this不适用于字段中重复的相同文本,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/51874409/

28 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com