gpt4 book ai didi

java - 按主题搜索并从维基百科的文章中提取关键字

转载 作者:行者123 更新时间:2023-11-30 09:58:00 26 4
gpt4 key购买 nike

我正在用 Java 做一个项目,我必须在其中处理维基百科转储文件。我正在寻找一个库来提取维基百科文章中的关键字......基本上我想阅读维基百科 xml 转储中的每个标签页并将其与主题和类别列表进行比较,如果它是正确的,选择它并添加我的结果。我对阅读转储或编写维基百科结果不感兴趣,我只想知道任何允许我按维基百科文章标题和文本中的主题搜索的库......例如......如果输入是“狗”我想要关于狗的维基百科文章,如果可能的话,狗类别下的任何页面。

一个图书馆是否为通用目的而被指定为维基百科并不重要。我需要将维基文本作为参数并接收到关键字列表,包括类别...我发现一些维基百科库可以正常工作,如 Wikipedia-MinerJava Wikipedia Library但首先我需要安装 mysql 并且我想分析文本而不将其保存到数据库中。

任何形式的帮助或建议都会受到欢迎。 :)

最佳答案

看起来这是您最好的选择:Java Wikipedia Library

关于java - 按主题搜索并从维基百科的文章中提取关键字,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/1315260/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com