java - 在 lucene FuzzyQuery 中改变相似度-6ren

java - 在 lucene FuzzyQuery 中改变相似度

转载作者：行者123 更新时间：2023-11-30 07:14:47

31

4

我想在搜索索引之前更改相似度。我所做的是:

QueryParser parser = new QueryParser(Version.LUCENE_43, "field", standarAnalyzer);
System.out.println("similarity before: " + parser.getFuzzyMinSim());
parser.setFuzzyMinSim(0.6f);
System.out.println("similarity after: " + parser.getFuzzyMinSim());
Query query = parser.parse(inputString); // inputString is given by the user
System.out.println("Querystring: " + query.toString());

现在，当 inputString = "something~"时，我得到这个输出

similarity before: 2.0
similarity after: 0.5
Querystring: field:something~2 // Why 2!?

我的问题:

为什么相似度一开始设置为2.0(我以为默认是0.5)？
为什么调用setFuzzyMinSim方法后还是2.0？

最佳答案

FuzzyQuery 在 Lucene 版本 4 中发生了重大变化。“~”后面的数字是最大编辑距离，而不是最小相似度。我不太清楚 FuzzyMinSim 是如何映射到最大编辑距离的，就像 StandardQueryParser 生成 FuzzyQuery 时一样。请注意，使用 DefaultFuzzyMinSim在 4.x 中已弃用。

默认最大编辑距离为 2，FuzzyQuery 类不支持大于 2 的编辑距离，因此标准查询解析器也不支持。

关于java - 在 lucene FuzzyQuery 中改变相似度，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/18317546/

31

4

0

文章推荐： java - PermGen 中的对象分配

文章推荐： java如何获取完整的堆栈信息

文章推荐： javascript - 使用许多事件监听器优化 javascript 性能

文章推荐： java.lang.ArrayIndexOutOfBoundsException 从 Excel 文件读取

Lucene 对短语进行模糊搜索(FuzzyQuery + SpanQuery)
我正在寻找一种编码 lucene 模糊查询的方法，该查询可以搜索与确切短语相关的所有文档。如果我搜索“mosa员工赞赏”，则会返回包含“大多数员工赞赏”的文档作为结果。我尝试使用: FuzzyQeu
java - 在 lucene FuzzyQuery 中改变相似度
我想在搜索索引之前更改相似度。我所做的是: QueryParser parser = new QueryParser(Version.LUCENE_43, "field", standarAnalyz
java - Lucene BooleanQuery 与多个 FuzzyQuery 太慢
一个Document是一家公司的员工数据，具有多个字段名称，例如:empName、empId、departmentId 等。使用自定义分析器已对大约 400 万条数据建立了索引。搜索查询有一个 l
java - 在 Lucene-4.x 中将有效负载提升与 FuzzyQuery 结合使用
是否有机会使用描述的有效负载提升here与 FuzzyQuery ？或者也许有人可以建议实现混合模糊/有效负载搜索的最佳策略是什么。目前，我在索引中有一些文档，其中某些部分使用本文中描述的技术获得了
java - Apache Lucene QueryParser.parse 未在 FuzzyQuery 上使用分析器
使用 TermQuery 和 PhraseQuery 时，我的 SerbianAnalyzer 会被调用，但使用 FuzzyQuery 时则不会。我尝试使用 lucene 4 和 lucene 7 两

首页

博学

6Ren·AI

商城

java - 在 lucene FuzzyQuery 中改变相似度