gpt4 book ai didi

hadoop - Hadoop 1.03和Nutch 1.5问题

转载 作者:行者123 更新时间:2023-12-02 20:12:31 25 4
gpt4 key购买 nike

当我尝试在hadoop 1.03上运行nutch-1.5时,出现以下错误。

hadoop jar nutch-1.5.job org.apache.nutch.crawl.Crawl urls -dir urls -depth 1 -topN 5

**Caused by: java.io.IOException: can't find class: org.apache.nutch.protocol.ProtocolStatus because org.apache.nutch.protocol.ProtocolStatus**

我在nutch-1.3上看到了错误报告 https://issues.apache.org/jira/browse/NUTCH-1084,但似乎尚未解决。
任何帮助表示赞赏。

我遵循以下教程:

http://wiki.apache.org/nutch/NutchHadoopTutorial

http://wiki.apache.org/nutch/NutchTutorial

http://wiki.apache.org/hadoop/HowToConfigure

编辑

我遵循本教程 http://www.rui-yang.com/develop/build-nutch-1-4-cluster-with-hadoop/,它对我有用。我不知道到底是什么解决了这个问题。我在单个节点上运行hadoop。
我进行以下更改:

1.将hadoop-env.sh,core-site.xml,hdfs-site.xml,mapred-site.xml,master,slave从hadoop / conf复制到nutch / conf并重建nutch

2.导出CLASSPATH =:$ NUTCH_HOME / runtime / local / lib

我创建以下教程 http://dataspider.blogspot.com.es/2012/09/instalacion-de-hadoop.html

最佳答案

如果要使用hadoop 1.0.3,请使用nutch1.5.1代替1.5

查看nutch1.5.1的发行说明
https://issues.apache.org/jira/secure/ReleaseNote.jspa?projectId=10680&version=12321850

它没有说NUTCH-1084是否已在此版本中修复,但此版本中包含以下补丁
https://issues.apache.org/jira/browse/NUTCH-1398

关于hadoop - Hadoop 1.03和Nutch 1.5问题,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/12357448/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com