gpt4 book ai didi

ElasticSearch 结果不相关

转载 作者:行者123 更新时间:2023-11-29 02:52:17 24 4
gpt4 key购买 nike

在 ElasticSearch 中,我创建了两个包含一个字段“CategoryMajor”的文档

在 doc1 中,我将 CategoryMajor 设置为“Restaurants”

在 doc2 中,我将 CategoryMajor 设置为“Restaurants Restaurants Restaurants Restaurants Restaurants”

如果我搜索 CategoryMajor:Restaurants,doc1 显示为比 doc2 更相关。这不是典型的 Lucene 行为,一个术语出现的次数越多,相关性就越高。 doc2 应该比 doc1 更相关。

我该如何解决这个问题?

最佳答案

您可以将 &explain=true 添加到您的 GET 查询中,以查看 doc2 的分数被“fieldNorm”因子降低了。这是由默认的 lucene 相似度计算公式引起的,它会降低较长文档的分数。请阅读有关默认 lucene 相似度公式的文档:

http://lucene.apache.org/core/3_6_0/api/all/org/apache/lucene/search/Similarity.html

要禁用此行为,请将 PUT 请求发送至:

http://localhost:9200/index/type/_mapping

带有请求正文:

{
"type": {
properties": {
"CategoryMajor": {
"type": "string",
"omit_norms": "true"
}
}
}
}

我不确定,但可能需要删除您的索引,重新创建它,放置上面的映射,然后重新索引您的文档。更改映射后重新索引肯定是必要的:)。

关于ElasticSearch 结果不相关,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/12323079/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com