gpt4 book ai didi

java - 如何设置我的 EMR 类路径

转载 作者:可可西里 更新时间:2023-11-01 14:22:29 27 4
gpt4 key购买 nike

我在 AWS EMR 集群上运行作业,遇到 Jackson 库冲突问题。基于文章 here我尝试添加引导步骤以使用以下脚本设置我的类路径:

#!/bin/bash
export HADOOP_USER_CLASSPATH_FIRST=true;
echo "HADOOP_CLASSPATH=s3n://bucket/myjar.jar" > /home/hadoop/conf/hadoop-user-env.sh

我已经构建了我的 jar,因此它的所有依赖项都包含在其中。执行此操作时遇到的第一个问题是我的启用调试步骤因以下错误而终止:

Exception in thread "main" java.lang.RuntimeException: java.lang.ClassNotFoundException: Class com.amazon.ws.emr.hadoop.fs.EmrFileSystem not found
at org.apache.hadoop.conf.Configuration.getClass(Configuration.java:1895)
at org.apache.hadoop.fs.FileSystem.getFileSystemClass(FileSystem.java:2427)
at org.apache.hadoop.fs.FileSystem.createFileSystem(FileSystem.java:2440)
at org.apache.hadoop.fs.FileSystem.access$200(FileSystem.java:88)
at org.apache.hadoop.fs.FileSystem$Cache.getInternal(FileSystem.java:2479)
at org.apache.hadoop.fs.FileSystem$Cache.get(FileSystem.java:2461)
at org.apache.hadoop.fs.FileSystem.get(FileSystem.java:372)
at com.amazon.elasticmapreduce.scriptrunner.ScriptRunner.fetchFile(ScriptRunner.java:39)
at com.amazon.elasticmapreduce.scriptrunner.ScriptRunner.main(ScriptRunner.java:56)
at sun.reflect.NativeMethodAccessorImpl.invoke0(Native Method)
at sun.reflect.NativeMethodAccessorImpl.invoke(NativeMethodAccessorImpl.java:57)
at sun.reflect.DelegatingMethodAccessorImpl.invoke(DelegatingMethodAccessorImpl.java:43)
at java.lang.reflect.Method.invoke(Method.java:606)
at org.apache.hadoop.util.RunJar.main(RunJar.java:212)
Caused by: java.lang.ClassNotFoundException: Class com.amazon.ws.emr.hadoop.fs.EmrFileSystem not found
at org.apache.hadoop.conf.Configuration.getClassByName(Configuration.java:1801)
at org.apache.hadoop.conf.Configuration.getClass(Configuration.java:1893)
... 13 more

所以我有两个问题,关于启用调试步骤还有什么问题?将我的类路径作为 s3 位置是否有效?如果不是,应该是什么值:

/path/to/my.jar

在上面指示的页面上的示例中吗?

最佳答案

查看您的 Bootstrap 操作,看起来您的字符串中可能有错误。该行应如下所示:

#!/bin/bash
export HADOOP_USER_CLASSPATH_FIRST=true
echo "HADOOP_CLASSPATH=/path/to/my.jar" >> /home/hadoop/conf/hadoop-user-env.sh

注意“>>”字符。单个 '>' 意味着您要用 'echo' 命令的输出替换整个文件,而双 '>>' 意味着您要在文件末尾追加该行脚本。此外,Bash 脚本中不需要分号。

引用文献:http://docs.aws.amazon.com/ElasticMapReduce/latest/DeveloperGuide/emr-hadoop-config_hadoop-user-env.sh.html

PS : Amazon 的 awesome support 发现了这个问题并回复了我的邮件;虽然这个问题不是我问的。所以这是对作者的归属 - 名为 Rendy O 的 AWS 支持工程师。

关于java - 如何设置我的 EMR 类路径,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/27536553/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com