gpt4 book ai didi

java - 使用 Lucene 提取英语单词

转载 作者:IT老高 更新时间:2023-10-28 21:11:37 26 4
gpt4 key购买 nike

我正在一个 Java 应用程序中处理一些英文文本,我需要对它们进行词干处理。例如,从文本“amenities/amenity”我需要得到“amenit”。

函数如下:

String stemTerm(String term){
...
}

我找到了 Lucene Analyzer,但它看起来太复杂了,无法满足我的需求。 http://lucene.apache.org/java/2_2_0/api/org/apache/lucene/analysis/PorterStemFilter.html

有没有办法在不构建分析器的情况下使用它来词干?我不了解所有 Analyzer 业务...

编辑:我实际上需要词干提取+词形还原。 Lucene 可以做到这一点吗?

最佳答案

SnowballAnalyzer 已弃用,您可以改用 Lucene Porter Stemmer:

 PorterStemmer stem = new PorterStemmer();
stem.setCurrent(word);
stem.stem();
String result = stem.getCurrent();

希望对您有所帮助!

关于java - 使用 Lucene 提取英语单词,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/5391840/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com