gpt4 book ai didi

lucene - 配置自定义 Lucene 分析器以接受某些停用词

转载 作者:行者123 更新时间:2023-12-02 04:33:17 27 4
gpt4 key购买 nike

我需要修改 lucene 分析器,使其能够识别单词“Ben”(荷兰语停用词)。请进一步指导我。如何让 Lucene 分析器接受这个单词作为常规单词?

服务器的Repository.xml

<paramname="analyzer"value="org.hippoecm.repository.query.lucene.StandardHippoAnalyzer"/>

工作空间.xml

<?xmlversion="1.0"encoding="UTF-8"?>
<Workspacename="default">
<!--
virtual file system of the workspace:
class: FQN of class implementing the FileSystem interface
-->
<FileSystemclass="org.apache.jackrabbit.core.fs.mem.MemoryFileSystem">
</FileSystem>
<!--
persistence manager of the workspace:
class: FQN of class implementing the PersistenceManager interface
-->
<PersistenceManagerclass="org.apache.jackrabbit.core.persistence.mem.InMemPersistenceManager">
</PersistenceManager>
<!--
Search index and the file system it uses.
class: FQN of class implementing the QueryHandler interface
-->
<SearchIndexclass="org.apache.jackrabbit.core.query.lucene.SearchIndex">
<paramname="path"value="${wsp.home}/index"/>
</SearchIndex>
</Workspace>

最佳答案

最简单的方法是:

将以下类复制到本地项目

http://svn.onehippo.org/repos/hippo/hippo-cms7/repository/tags/hippo-repository-2.24.02/engine/src/main/java/org/hippoecm/repository/query/lucene/StandardHippoAnalyzer.java

更改Java包和文件名。

删除可能影响您的问题的停用词(请参阅上面的 Java 代码)。

更新您的repository.xml,以使用带有新包和类名的分析器

删除现有的 lucene 索引并重新启动 Hippo。

$ mvn clean package && mvn -Pcargo.run

应该可以了。

关于lucene - 配置自定义 Lucene 分析器以接受某些停用词,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/15771796/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com