gpt4 book ai didi

java - 用于净化文本的 Lucene 库(复数、动词......)

转载 作者:太空宇宙 更新时间:2023-11-04 11:15:08 25 4
gpt4 key购买 nike

我需要一些帮助来在我的 Java 应用程序中使用 Lucene 来简化文本。

我自己已经做到了,但我没有动词和复数的解决方案。

我该如何处理?

最佳答案

如果我正确理解你的问题,你想从文本中检测名词/动词。据我所知,Lucene 本身没有能力检测到这一点。您可以查看 OpenNLP库是一个

machine learning based toolkit for the processing of natural language text

因此,它将使用训练模型和预测等概念。它有一个 POSTagger API(词性标注器)——你可以看看它的用法 here在文档和一些详细示例中 here , herehere .

Java中另一个优秀的框架是Stanford Core NLP您可以查看斯坦福对数线性词性标注器 here

关于java - 用于净化文本的 Lucene 库(复数、动词......),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/45535666/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com