gpt4 book ai didi

search - Lucene 评分结果

转载 作者:行者123 更新时间:2023-12-03 04:18:44 27 4
gpt4 key购买 nike

在 Lucene 中,如果您有多个索引,每个索引仅覆盖一个分区。为什么不同索引上的相同搜索会返回不同分数的结果?来自不同服务器的结果完全匹配。

即如果我搜索:

  • 姓名 - 约翰·史密斯
  • 出生日期 - 1934 年 11 月 11 日

分区 0 将返回 0.345 的分数

分区 1 将返回 0.337 的分数

两者的姓名和出生日期完全匹配。

最佳答案

scoring包含逆文档频率(IDF)。如果术语“John Smith”在一个分区中出现 0、100 次,在分区 1 中出现一次。在分区 1 中搜索 John Smith 的得分会更高,因为该术语更加稀有。

要解决这个问题,您必须将索引覆盖所有分区,否则您需要覆盖 IDF。

关于search - Lucene 评分结果,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/387/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com