gpt4 book ai didi

Solr 邻近搜索评分

转载 作者:行者123 更新时间:2023-12-04 03:08:40 24 4
gpt4 key购买 nike

我是 Solr 的新手,正在研究基本的评分模型。我了解基本评分模型使用 bool 值生成文档集,然后使用向量空间模型根据相关性进行评分以进行排名。我想知道的是,在使用邻近搜索时,搜索结果在生成后是否也会根据向量空间模型进行排名,还是仅根据编辑距离进行评分?

最佳答案

首先,org.apache.lucene.search.similarities.TFIDFSimilarity中使用了VSM score (请记住,这不是最近版本的 Lucene 中的默认相似度)。例如,org.apache.lucene.search.similarities.BM25Similarity实现了类似的东西,而是称为 bag of words .

在邻近搜索的情况下,基类 org.apache.lucene.search.similarities.Similarity有一个嵌套类 Similarity.SimScorer它负责对“草率”查询进行评分,例如 SpanQuery , 和 PhraseQuery .通常,有一种方法计算sloppyFreq ,它是编辑距离的函数,在公式中作为附加系数添加。

sloppyFreq 的默认实现之一是1.0f / (distance + 1) ,但当然可以根据您的需要进行定制。

关于Solr 邻近搜索评分,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/46926856/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com