java - Lucene EdgeNGramTokenFilter 评分-6ren

java - Lucene EdgeNGramTokenFilter 评分

转载作者：太空宇宙更新时间：2023-11-04 07:12:42

我在索引期间使用过滤器 EdgeNGramTokenFilter。

当我寻找一个词时。当 Lucene 找到完整单词或另一个单词的一部分时，它的评分不会产生差异。

例如，如果我正在查找单词 PUB。我希望在结果顶部看到每个 PUB，并且仅在 PUBLIC 一词之后。

谢谢

最佳答案

我找到了解决方案:

我创建两个字段，一个将被分析(edgeNgrams)，一个不会被分析

TextField field = new TextField(FULLTEXT_COL, value, Field.Store.NO);
d.add(field);
//exact search
Field exactField = new TextField(FullTextIndexationManager.EXACT_COL + FULLTEXT_COL, value, Field.Store.NO);                    
d.add(exactField);

我使用 PerFieldAnalyzerWrapper 来分配分析器

Map<String, Analyzer> analyzerPerField = new HashMap<>();
analyzerPerField.put(FullTextIndexationManager.EXACT_COL + FULLTEXT_COL, new StandardAnalyzer(Version.LUCENE_44));
PerFieldAnalyzerWrapper aWrapper = new PerFieldAnalyzerWrapper(customAnalyzer, analyzerPerField);

当我在两个字段中搜索时

keys.add(FullTextIndexationManager.FULLTEXT_COL);
    values.add(QueryParser.escape(value));
    occurs.add(BooleanClause.Occur.SHOULD);
    //exact search
    keys.add(FullTextIndexationManager.EXACT_COL+FullTextIndexationManager.FULLTEXT_COL);
    values.add(QueryParser.escape(value));
    occurs.add(BooleanClause.Occur.SHOULD);
    Query q = MultiFieldQueryParser.parse(Version.LUCENE_44, queries, fields, flags, ontologySearch.getAnalyzer());

当我找到一个确切的术语时，它会得分两倍

关于java - Lucene EdgeNGramTokenFilter 评分，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/20424753/

文章推荐： c - C 程序的奇怪行为::Kernighan & Ritchie 练习 2-3

文章推荐： C写入后附加到文件

文章推荐： python - 我想要一个反斜杠 - 而不是两个

java - 如何解决 NoSuchMethodError :EdgeNGramTokenFilter
现在我的 schma.xml 配置是:
java - Lucene EdgeNGramTokenFilter 评分
我在索引期间使用过滤器 EdgeNGramTokenFilter。当我寻找一个词时。当 Lucene 找到完整单词或另一个单词的一部分时，它的评分不会产生差异。例如，如果我正在查找单词 PUB。我

太空宇宙

个人简介

我是一名优秀的程序员,十分优秀！

作者热门文章

滴滴打车优惠券免费领取

全站热门文章

首页

博学

6Ren·AI

商城

java - Lucene EdgeNGramTokenFilter 评分