gpt4 book ai didi

java - Lucene TextField 未标记化

转载 作者:行者123 更新时间:2023-12-01 22:18:11 27 4
gpt4 key购买 nike

我正在将以下标题保存到索引

doc.add(new TextField(TITLE, "Button",Field.Store.YES ));

然后,当我用“butto”搜索它时,什么也没有返回。我必须搜索“按钮”才能取回任何东西。我必须做什么才能使按钮的任何子字符串给出结果?我正在使用

 StandardAnalyzer analyzer = new StandardAnalyzer();

最佳答案

StandardAnalyzer 仅为输入文本创建标记 button,因此,只有 button 的查询与文档匹配。要搜索按钮的任何子字符串,您有两种选择。

在搜索时,您可以使用不同的查询,例如一个PrefixQueryWildcardQuery 。如果您使用查询解析器,则可以使用 butto?butto*

在索引时,您可以使用不同的分析器,该分析器将子字符串作为标记发出,例如 EdgeNGramTokenizer它将根据配置发出 [bu, but, butt, butto, button] ;或NGramTokenizer ,这将针对配置的大小发出 [bu, ut, tt, to, on] 等。

关于java - Lucene TextField 未标记化,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/30563920/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com