gpt4 book ai didi

hadoop - 异常线程 "main"org.apache.hadoop.mapreduce.lib.input.InvalidInputException :Input path does not exist: hdfs:host/user/yogesh/WordCount

转载 作者:可可西里 更新时间:2023-11-01 16:06:59 27 4
gpt4 key购买 nike

  1. 我已经创建了输入文本文件 test.txt 并将其作为/user/yogesh/Input/test.txt 放入 HDFS
  2. 在 HDFS 上创建输出路径为/user/yogesh/Output
  3. 在本地创建 jar 文件/home/yogesh/WordCount.jar 并从本地提交 MR 作业,如下所示:hadoop jar/home/yogesh/WordCount.jar WordCount/user/yogesh/Input/test。 txt/user/yogesh/Output/output1

我有以下错误:

Exception in thread "main"
org.apache.hadoop.mapreduce.lib.input.InvalidInputException:Input path does not exist: hdfs:host/user/yogesh/WordCount.

hdfs:host/user/yogesh/- 是我的 HDFS 目录。我无法理解为什么这个 MR 作业在 HDFS 中查找代码以及如何解决此错误。

最佳答案

尝试将 WordCount 类的名称包作为其前缀,或者跳过该类并仅使用 jar、输入、输出,就像这样:

hadoop jar /home/yogesh/WordCount.jar /user/yogesh/Input /user/yogesh/Output/output1

此外,请确保在执行此命令之前 /user/yogesh/Output/output1 不存在。另外,请注意您应该提供输入目录而不是输入文件。 Hadoop 会将指定目录中的所有文件作为输入。

有关示例,请参阅 this site 中的 WordCount 示例是如何运行的.

关于hadoop - 异常线程 "main"org.apache.hadoop.mapreduce.lib.input.InvalidInputException :Input path does not exist: hdfs:host/user/yogesh/WordCount,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/35653411/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com