gpt4 book ai didi

web-crawler - 什么是好的 Web Crawler 工具

转载 作者:行者123 更新时间:2023-12-03 14:51:01 36 4
gpt4 key购买 nike

关闭。这个问题是off-topic .它目前不接受答案。












想改善这个问题吗? Update the question所以它是 on-topic对于堆栈溢出。

8年前关闭。




Improve this question




我需要索引很多网页,有哪些好的网络爬虫工具?我更喜欢 .NET 可以与之交谈的东西,但这不是一个亮点。

我真正需要的是我可以提供一个站点 url 的东西,它会跟随每个链接并存储用于索引的内容。

最佳答案

HTTrack -- http://www.httrack.com/ -- 是一个非常好的网站复印机。效果很好。已经使用它很长时间了。

Nutch 是一个网络爬虫(爬虫就是你要找的那种程序)--http://lucene.apache.org/nutch/ -- 它使用一流的搜索实用程序 lucene。

关于web-crawler - 什么是好的 Web Crawler 工具,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/176820/

36 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com