gpt4 book ai didi

java - 解析 XML 提要

转载 作者:行者123 更新时间:2023-12-02 07:33:17 24 4
gpt4 key购买 nike

我想要解析网站的 RSS 提要并想要获取内容(例如文章)并将它们放入数据库中。后来我还想根据搜索关键字对它们进行索引。谁能告诉我如何进行吗?为此最好使用什么工具?我搜索了 Apache lucene、solr 和 apache nutch。但我仍然不清楚如何用java等编程语言实现它。谁能提供有关实现的更多详细信息。

提前致谢。

最佳答案

首先,我会通读 Java API for XML Processing .

接下来,我将熟悉一些网络 API...

我也会熟悉 xPathHow xPath Works ,这对于查找您感兴趣的文档部分很有用。

接下来,我会变成JDBC(TM) Database Access

这应该涵盖了基础知识。

一旦您对技术有了基本的了解,您就需要考虑设计。我将它的元素分离到它自己的项目中。

将下载、解析、排序数据并将其插入数据库作为一个项目进行处理。

在另一个中处理搜索和检索。

这将突出显示重叠区域,并向您展示需要在何处提供公共(public)库。

关于java - 解析 XML 提要,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/12650281/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com