gpt4 book ai didi

c# - Lucene.net/Lucene 的最低分数?

转载 作者:行者123 更新时间:2023-12-02 22:14:38 24 4
gpt4 key购买 nike

是否可以设置在 Lucene 中返回结果的最低分数?

我有这个功能:

public Tuple<int,ICollection<Guid>> Search(string searchQuery,int maxResults)
{
var booleanQuery = new BooleanQuery();
var s1 = new TermQuery(new Term("companyName", searchQuery));
booleanQuery.Add(s1, Occur.SHOULD);

using (var searcher = new IndexSearcher(this.Directory))
{
TopDocs hits = searcher.Search(booleanQuery, maxResults);

var ids = new List<Guid>();
for (int i = 0; i < hits.ScoreDocs.Count(); i++)
{
var idString = searcher.Doc(hits.ScoreDocs[i].Doc).Get("id");
ids.Add(new Guid(idString));
}
return new Tuple<int, ICollection<Guid>>(hits.TotalHits, ids);
}
}

该函数搜索我的索引并返回与 searchQuery 匹配的公司 ID,以及与搜索匹配的公司总数 - 因此我可以写“显示 245 家匹配公司中的 1-20 家”。

我的问题是匹配的阈值很低。如果用户输入“accountant”,搜索会返回有意义的结果,但如果用户输入“adasdfsdf”,则会返回不相关的结果。如果结果不够相关,我宁愿显示一条消息,例如“抱歉,没有公司匹配您的查询”。

是否可以为比赛设置最低分数? TopDocs.TotalHits 属性会考虑这个分数吗?

最佳答案

简而言之,没有。您无法真正在 Lucene 中创建最低分数截止点。这是一个discussion of why not .请注意,讨论的案例与您的要求略有不同,但困难大致相同(事实上,提供一个合理的分界点以用于不同的、独立的查询会引入更大但密切相关的问题,困难)。

解决这个问题的更好方法是设计您的查询,这样您就不会得到不相关的结果。在你的例子中,我真的不明白为什么你会看到很多不相关的结果出现,所以我假设有其他术语被添加到查询中。在这种情况下,如果您只想获取匹配 new Term("companyName", searchQuery) 的那些文档,您应该使用 Occur.MUST 添加它 bool 子句,例如:

var booleanQuery = new BooleanQuery();
var s1 = new TermQuery(new Term("companyName", searchQuery));
booleanQuery.Add(s1, Occur.MUST);

进一步解释,Occur.MUSTOccur.SHOULD 是您的问题所在。如果您有这样的查询:

category:type1 companyName:asdfdas

如果没有关于 companyName 的结果,那么您只会看到查询 category:type1 的结果。如果您在 companyName 上确实有匹配项,这些结果将被判断为具有更高的相关性,并且将首先显示,但它仍然会显示与该类别匹配的所有内容,只是在列表的较低位置。在该示例中,这两个术语都添加了 BooleanClause.Occur.SHOULD。 , 因此两者都是可选的(尽管仍然必须在任何结果中找到至少一个匹配项)。

如果您希望只显示与类别和公司名称都匹配的那些术语,您应该在查询中将它们都设置为必填术语,方法是使用 BooleanClause.Occur.MUST .使用查询语法,这看起来像:

+category:type1 +companyName:asdfdas

或者构建一个 BooleanQuery:

var s1 = new TermQuery(new Term("companyName", "asdfdas"));
booleanQuery.Add(s1, Occur.MUST);
var s1 = new TermQuery(new Term("category", "type1"));
booleanQuery.Add(s1, Occur.MUST);

关于c# - Lucene.net/Lucene 的最低分数?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/14692228/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com