gpt4 book ai didi

java - 将 MySQL 连接到 Apache nutch

转载 作者:可可西里 更新时间:2023-11-01 08:00:43 26 4
gpt4 key购买 nike

我是第一次使用 Apache Nutch。爬取后如何将数据存储到MySQL数据库中?我希望能够在其他 Web 应用程序中轻松使用这些数据。

我找到了一个 question related , 但我不清楚 MySQL 连接器替换了代码 ID 的哪一部分。请帮助提供一个简短的代码示例。

最佳答案

http://mirror.nyi.net/apache//nutch/apache-nutch-1.2-src.zip获取源代码

在编辑器中打开 org.apache.nutch.crawl.Crawl 类。

查找变量Path crawlDb = new Path(dir + "/crawldb");

该变量将提示在何处替换代码以获得您自己的 CustomMySQLCrawl 类。

持久化发生在这个调用中:crawlDbTool.update(crawlDb, segs, true, true);//update crawldb 所以你应该把它保存到数据库中。此时您可能要考虑集成 hibernate。

关于java - 将 MySQL 连接到 Apache nutch,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/4673757/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com