gpt4 book ai didi

java - 如何开始构建基于 Java 的网络抓取工具

转载 作者:行者123 更新时间:2023-12-02 07:42:47 25 4
gpt4 key购买 nike

开始构建网络抓取工具的最佳(也是最短)方法是什么,该工具足够灵活,可以与几乎所有类型的网站一起使用,并且能够将这些网站存储在数据库中以供检索。

我想构建类似于“google 搜索”的东西,其中“google 搜索”在进行搜索之前将所有网站缓存到其服务器。

这是我的研究项目的组成部分之一。

请告诉我是否已经有一些开源项目,这将使我的任务变得更容易。

我更喜欢用 java 来构建这个。

最佳答案

类似于 heritrix例如?

关于java - 如何开始构建基于 Java 的网络抓取工具,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/11363527/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com