有责任。如果我想将自己的常用词添加到分析器过滤器中怎么办?我如何添加计算机、-6ren">
gpt4 book ai didi

java - 如何使用 Lucene 构建我自己的 "common word"过滤器

转载 作者:行者123 更新时间:2023-11-30 04:29:03 24 4
gpt4 key购买 nike

我知道 Lucene 使用停用词(常见)过滤器进行搜索,我也知道对于这项工作,标准分析器EnglishAnalyzer> 有责任。如果我想将自己的常用词添加到分析器过滤器中怎么办?我如何添加计算机、互联网、系统等词语

最佳答案

我认为“常用词”指的是停用词

为了添加到标准列表,只需使用 StandardAnalyzer 的另一个构造函数(它接受 CharArraySetReader 形式的停用词)。要获取标准停用词集,请使用 StopAnalyzer.STOP_WORDS_SET

关于java - 如何使用 Lucene 构建我自己的 "common word"过滤器,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/15092609/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com