gpt4 book ai didi

apache - bin/nutch 注入(inject)爬网/crawldb 网址不起作用

转载 作者:行者123 更新时间:2023-12-04 02:10:09 25 4
gpt4 key购买 nike

我刚刚按照教程从 NutchWiki 设置了 Nutch .

下载 Nutch 2.x src 并设置所有配置。问题出现在我刚开始爬取的时候。当我运行此代码时:bin/nutch inject crawl/crawldb urls 我收到这样的错误消息:Unrecognized arg urls我只是按照教程中的所有步骤,创建目录,更改配置文件等。而且我还有一个问题,即 apache-nutch-2.x/runtime/local/中没有 crawdb 目录是自动生成的还是需要手动生成吗?对此问题的任何帮助将不胜感激。

最佳答案

我遇到了同样的问题。该文档似乎已过时。它适用于 1.x。

对于 2.x,我尝试了以下方法并且对我有用。

bin/nutch inject urls

希望对您有所帮助。

关于apache - bin/nutch 注入(inject)爬网/crawldb 网址不起作用,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/39360980/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com