gpt4 book ai didi

hadoop - Apache nutch 1.15 安装和运行问题

转载 作者:行者123 更新时间:2023-12-02 19:15:28 26 4
gpt4 key购买 nike

我正在尝试在 Windows 10 上运行 Apache Nutch 1.15(本地),我已按照 https://wiki.apache.org/nutch/NutchTutorial 中提到的相同步骤进行操作。和 https://wiki.apache.org/nutch/NutchHadoopSingleNodeTutorial .
当我尝试在 cygwin 上使用此命令注入(inject) url 时: bin/nutch injection crawl/crawldb urls 我收到此错误:

Injector: java.io.IOException: (null) entry in command string: null chmod 
0644 C:\Users\INFO\Desktop\apache-nutch1.15\runtime\local\crawl\crawldb\.locked

当放 %HADOOP_HOME%在系统路径上(在 Apache Nutch error: Injector: java.io.IOException: (null) entry in command string: null chmod 0644 上提出的解决方案)

我收到一个新错误:
Exception in thread "main" java.lang.UnsatisfiedLinkError: org.apache.hadoop.io.nativeio.NativeIO$Windows.access0(Ljava/lang/String;I)Z

顺便说一句,HADOOP_HOME 我已经尝试了 hadoop-2.8.0 和 winutil 文件夹,但同样的问题。

请帮忙。

最佳答案

这是 nutch 中的一个已知问题。请在下面找到 JIRA 和修复程序。如果您在本地 bin/nutch 文件中应用来自 GIT 的更改,一切都会再次正常运行。当 nutch 1.16 发布时,这将作为修复包含在内

吉拉:https://issues.apache.org/jira/browse/NUTCH-2639?page=com.atlassian.jira.plugin.system.issuetabpanels%3Aall-tabpanel

修复:https://github.com/apache/nutch/pull/378/commits/7e4502089ecebd194c75719485b6fce1a65797e9

关于hadoop - Apache nutch 1.15 安装和运行问题,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/55895737/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com