- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我想在搜索索引之前更改相似度。我所做的是:
QueryParser parser = new QueryParser(Version.LUCENE_43, "field", standarAnalyzer);
System.out.println("similarity before: " + parser.getFuzzyMinSim());
parser.setFuzzyMinSim(0.6f);
System.out.println("similarity after: " + parser.getFuzzyMinSim());
Query query = parser.parse(inputString); // inputString is given by the user
System.out.println("Querystring: " + query.toString());
现在,当 inputString = "something~"时,我得到这个输出
similarity before: 2.0
similarity after: 0.5
Querystring: field:something~2 // Why 2!?
我的问题:
最佳答案
FuzzyQuery
在 Lucene 版本 4 中发生了重大变化。“~”后面的数字是最大编辑距离,而不是最小相似度。我不太清楚 FuzzyMinSim
是如何映射到最大编辑距离的,就像 StandardQueryParser
生成 FuzzyQuery
时一样。请注意,使用 DefaultFuzzyMinSim在 4.x 中已弃用。
默认最大编辑距离为 2,FuzzyQuery
类不支持大于 2 的编辑距离,因此标准查询解析器也不支持。
关于java - 在 lucene FuzzyQuery 中改变相似度,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/18317546/
我正在寻找一种编码 lucene 模糊查询的方法,该查询可以搜索与确切短语相关的所有文档。如果我搜索“mosa员工赞赏”,则会返回包含“大多数员工赞赏”的文档作为结果。 我尝试使用: FuzzyQeu
我想在搜索索引之前更改相似度。我所做的是: QueryParser parser = new QueryParser(Version.LUCENE_43, "field", standarAnalyz
一个Document是一家公司的员工数据,具有多个字段名称,例如:empName、empId、departmentId 等。 使用自定义分析器已对大约 400 万条数据建立了索引。 搜索查询有一个 l
是否有机会使用描述的有效负载提升here与 FuzzyQuery ?或者也许有人可以建议实现混合模糊/有效负载搜索的最佳策略是什么。 目前,我在索引中有一些文档,其中某些部分使用本文中描述的技术获得了
使用 TermQuery 和 PhraseQuery 时,我的 SerbianAnalyzer 会被调用,但使用 FuzzyQuery 时则不会。我尝试使用 lucene 4 和 lucene 7 两
我是一名优秀的程序员,十分优秀!