gpt4 book ai didi

maven - 是否可以在没有 Cygwin 的情况下在 Windows 上以本地模式运行 Hadoop 作业(如 WordCount 示例)?

转载 作者:可可西里 更新时间:2023-11-01 14:25:02 26 4
gpt4 key购买 nike

我有 Windows 7、Java 8、Maven 和 Eclipse。我创建了一个 Maven 项目并使用了与 here 几乎完全相同的代码.

这只是一个简单的“字数统计”示例。我尝试从 Eclipse 启动“驱动程序”程序,我提供命令行参数(输入文件和输出目录)并收到以下错误:

Exception in thread "main" java.lang.NullPointerException   at
java.lang.ProcessBuilder.start(ProcessBuilder.java:1012) at
org.apache.hadoop.util.Shell.runCommand(Shell.java:404) at
org.apache.hadoop.util.Shell.run(Shell.java:379) at
org.apache.hadoop.util.Shell$ShellCommandExecutor.execute(Shell.java:589) at
org.apache.hadoop.util.Shell.execCommand(Shell.java:678) at
org.apache.hadoop.util.Shell.execCommand(Shell.java:661) at
org.apache.hadoop.fs.RawLocalFileSystem.setPermission(RawLocalFileSystem.java:639) at
org.apache.hadoop.fs.RawLocalFileSystem.mkdirs(RawLocalFileSystem.java:435) at
org.apache.hadoop.fs.FilterFileSystem.mkdirs(FilterFileSystem.java:277) at
org.apache.hadoop.mapreduce.JobSubmissionFiles.getStagingDir(JobSubmissionFiles.java:125) at
org.apache.hadoop.mapreduce.JobSubmitter.submitJobInternal(JobSubmitter.java:344) at
org.apache.hadoop.mapreduce.Job$10.run(Job.java:1268) at
org.apache.hadoop.mapreduce.Job$10.run(Job.java:1265) at
java.security.AccessController.doPrivileged(Native Method) at
javax.security.auth.Subject.doAs(Subject.java:422) at
org.apache.hadoop.security.UserGroupInformation.doAs(UserGroupInformation.java:1491) at
org.apache.hadoop.mapreduce.Job.submit(Job.java:1265) at
org.apache.hadoop.mapreduce.Job.waitForCompletion(Job.java:1286) at
misc.projects.hadoop.exercises.WordCountDriverApp.main(WordCountDriverApp.java:29)

失败行 (WordCountDriverApp.java:29) 包含启 Action 业的命令:

job.waitForCompletion(true)

我想让它工作,因此我想了解一些东西:

如果我只想要本地模式(没有任何集群),我是否必须提供任何 hdfs-site.xml、yarn-site.xml 等所有这些?我现在没有这些 XML 配置文件。据我所知,本地模式的默认设置都可以,也许我错了。

是否有可能在 Windows 下(启动任何 Hadoop 作业)或整个 Hadoop 仅适用于 Linux?

附言:Hadoop 依赖如下:

<dependency>
<groupId>org.apache.hadoop</groupId>
<artifactId>hadoop-client</artifactId>
<version>2.2.0</version>
<scope>provided</scope>
</dependency>

最佳答案

  1. 下载 Hadoop 2.6.02.7.1为 Windows 编译
  2. 创建指向解压目录的 HADOOP_HOME 环境变量
  3. 将 %HADOOP_HOME%\bin 添加到 PATH 环境变量

来源:https://stackoverflow.com/a/27394808/543836

关于maven - 是否可以在没有 Cygwin 的情况下在 Windows 上以本地模式运行 Hadoop 作业(如 WordCount 示例)?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/26516865/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com