java.lang.IllegalArgumentException : Attempt to add ([custom-jar-with-spark-code]. jar) 多次到分布式缓存-6ren

java.lang.IllegalArgumentException : Attempt to add ([custom-jar-with-spark-code]. jar) 多次到分布式缓存

转载作者：行者123 更新时间：2023-11-30 05:40:33

24

4

我正在尝试使用 Oozie 在 EMR 集群上运行一个简单的 Java Spark 作业。该作业只是从输入路径获取文件，对其执行一些基本操作，并将结果放置在不同的输出路径中。

当我尝试使用 Spark-submit 从命令行运行它时，如下所示，它工作正常:

spark-submit --class com.someClassName --master yarn --deploy-mode cluster /home/hadoop/some-local-path/my-jar-file.jar yarn s3n://input-path s3n://output-path

然后我在 Oozie 工作流程中设置了相同的内容。然而，当从那里运行时，作业总是失败。标准输出日志包含此行:

Failing Oozie Launcher, Main class [org.apache.oozie.action.hadoop.SparkMain], main() threw exception, Attempt to add (hdfs://[emr-cluster]:8020/user/oozie/workflows/[WF-Name]/lib/[my-jar-file].jar) multiple times to the distributed cache.
java.lang.IllegalArgumentException: Attempt to add (hdfs://[emr-cluster]:8020/user/oozie/workflows/[WF-Name]/lib/[my-jar-file].jar) multiple times to the distributed cache.

我找到了KB note另一个 question StackOverflow 上处理了类似的错误。但对于他们来说，该作业由于内部 JAR 文件而失败 - 而不是用户传递运行的文件。尽管如此，我尝试了它的解决步骤来删除 share-lib 中 Spark 和 oozie 之间常见的 jar 文件，并最终从“/user/oozie/share/lib/lib_*/spark 中删除了一些文件”。不幸的是，这也没有解决问题。

关于如何调试此问题有什么想法吗？

最佳答案

所以我们终于解决了这个问题 - 至少在我们的例子中是这样。

使用 Hue 创建工作流时，添加 Spark Action 时，默认会提示输入"file"和“Jar/py 名称”。我们在这些字段中分别提供了要运行的 JAR 文件的路径和该 JAR 文件的名称，它创建了基本操作，如下所示:

它创建的最终 XML 如下:

<action name="spark-210e">
    <spark xmlns="uri:oozie:spark-action:0.2">
        <job-tracker>${jobTracker}</job-tracker>
        <name-node>${nameNode}</name-node>
        <master>yarn</master>
        <mode>cluster</mode>
        <name>CleanseData</name>
          <class>com.data.CleanseData</class>
        <jar>JCleanseData.jar</jar>
          <spark-opts>--driver-memory 2G --executor-memory 2G --num-executors 10 --files hive-site.xml</spark-opts>
          <arg>yarn</arg>
          <arg>[someArg1]</arg>
          <arg>[someArg2]</arg>
        <file>lib/JCleanseData.jar#JCleanseData.jar</file>        
    </spark>
    <ok to="[nextAction]"/>
    <error to="Kill"/>
</action>

默认file其中的标签导致了我们案例中的问题。

因此，我们删除了它并将定义编辑为如下所示并且有效。请注意 <jar> 的更改标签也是如此。

<action name="spark-210e">
    <spark xmlns="uri:oozie:spark-action:0.2">
        <job-tracker>${jobTracker}</job-tracker>
        <name-node>${nameNode}</name-node>
        <master>yarn</master>
        <mode>cluster</mode>
        <name>CleanseData</name>
          <class>com.data.CleanseData</class>
        <jar>hdfs://path/to/JCleanseData.jar</jar>
          <spark-opts>--driver-memory 2G --executor-memory 2G --num-executors 10 --files hive-site.xml</spark-opts>
          <arg>yarn</arg>
          <arg>[someArg1]</arg>
          <arg>[someArg1]</arg>
    </spark>
    <ok to="[nextAction]"/>
    <error to="Kill"/>
</action>

PS:我们在 Hive 操作上也遇到了类似的问题。 hive-site.xml我们应该通过 Hive 操作传递的文件 - 它创建了 <job-xml>标签 - 也引起了问题。所以我们删除了它并且它按预期工作。

关于java.lang.IllegalArgumentException : Attempt to add ([custom-jar-with-spark-code]. jar) 多次到分布式缓存，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/55741750/

24

4

0

文章推荐： javascript - 解释 requestAnimationFrame shim 层

文章推荐： javascript - 使用 Google Earth API 飞到 PlaceResult

文章推荐： java - 无法使用executeQuery()

文章推荐： javascript - three.js 看起来很奇怪的影子

ruby - YARD不把 `code`替换成code正常吗？
我刚刚开始使用 YARD 来记录我的 Rails 应用程序。我没有指定任何特定的标记处理程序，但我希望 `code` 会转换为 code，但这似乎没有发生。这是正常行为吗？我是否必须添加一些额外的选项
Code-Server实现在任何设备上运行VS Code
什么是Code-Server 首先程序员朋友们肯定都用过来自微软的VS Code 这款轻量而又高级的编辑器，拥有丰富的插件库，支持各种语言编译运行。而本文介绍的Code-Server就是coder 公
assembly - ASM 8086 : How is coding with multiple code segments different from coding with one code segment?
我是一名高中生，今年开始学习汇编。我目前正在制作 Pacman 克隆作为我的最终项目。我遇到的唯一问题是我的代码很大，*.exe 文件几乎有 64KB。所以我的问题是，如果我转向模型介质，我需要
language-agnostic - Code Golf : Code 39 Bar Code
锁定。这个问题及其答案是locked因为这个问题是题外话，但具有历史意义。它目前不接受新的答案或互动。挑战按字符计数绘制 Code 39 条码的 ASCII 表示的最短代码。维基百科关于代码 3
visual-studio-code - VS Code 的扩展如何获取 VS Code 的安装路径？
我正在开发 VS 代码的扩展(使用 javascript)。现在我需要安装 VS Code 的路径。 windows有一种方法: var child = require('child_process'
visual-studio-code - 如何更改 VS Code Code.exe 更新路径？
[Windows 10] 我在自定义目录中安装了“Microsoft VS Code(用户设置)”，每当我尝试更新它时，都会显示: 然后这个 Log Info Dec 23 11:42:40.673
visual-studio-code - VS Code 安装 Visual Studio Code 更新失败
我正在尝试更新我的 VS 代码，但收到一条错误消息:由于防病毒软件和/或进程失控，更新可能会失败。附加了一个来 self 的用户的日志文件，但我不确定要检查什么。我对计算机和编程还是个新手。最佳答
visual-studio-code - Code-OSS 无法从终端命令 'code-oss .' 打开文件夹或文件
几天前我安装了 Kali Linux。我正在尝试使用 Code-OSS 而不是 VSCode，因为最新版本的 Kali 没有安装普通版本所需的库。如果我尝试使用 code-oss . 或 code
visual-studio-code - 如何在 Visual Studio Code/VS Code 中突出显示当前行号
我正在从 Atom 迁移到 VS Code，因为这似乎是当今所有酷 child 都在使用的东西。在 atom 中，我能够如图所示突出显示当前行号(装订线中的蓝色突出显示)。有没有办法在 VS Co
g-code - 寻找 G Code 语法规范，尝试制作简单的 G Code 解析器
我试图找到一个明确的 G 代码语法规范，而不是单个 G 代码的含义，我无处不在的规范，我的意思是详细的语法规范，目的是编写解析器。我编写解析器没有问题，我只是在寻找语法规范，例如。我知道您不必总是为
visual-studio-code - 为什么 Fira Code 字体在 VS Code 中看起来很模糊？
我想在 VS Code (Windows) 中使用 Fira Code，并且已经按照 instructions 中的说明配置了字体。。不知何故，字体看起来很模糊。我该如何解决这个问题？ "edito
visual-studio-code - 如何转到 Visual Studio Code (VS Code) 中的上一个位置
这个问题已经有答案了: How can I navigate back to the last cursor position in Visual Studio Code? (16 个回答) 已关闭
visual-studio-code - 如何在 Visual Studio Code (VS Code) 中选择当前单词？
如何选择当前单词，即插入符号所在的位置。注意:我正在寻找 Visual Studio Code(VS Code)(文本编辑器)的快捷方式，而不是 Visual Studio IDE。最佳答案在
visual-studio-code - 无法在 VS Code 中安装 'Dart-Code.flutter'
我需要在 VS Code 中安装 flutter 但在安装扩展中，我有这个错误 Unable to install 'Dart-Code.flutter'; there is no available
java - JavaDoc 中的 {@code memberData} 和 memberData 有什么区别
{@code memberData} 和有什么区别？和 memberData在 JavaDoc 中最佳答案有两个主要区别: {@code ...}更简洁:更易于阅读(和输入)。 {@code ..
PHP:替换字符串中所有出现的 "[CODE]...[/CODE]"
我有这样一个字符串: Here is my code sample, its not too great: [CODE] [/CODE] I hope you enjoy. 现在我想用 highli
visual-studio-code - VS Code 不排除 Code 的 node_modules 被监视 - 已达到文件监视限制
在 VS Code 中，我有一个少于 50 个文件的 Vue 项目，但是在运行开发服务器时 VS Code 抛出 Error: ENOSPC: System limit for number of f
visual-studio-code - 在 Visual Studio Code 中使用 Source Code Pro ExtraLight
Source Code Pro 如何在 VSC 中使用 ExtraLight ~？似乎以下不起作用...... 我确定我有字体。 Source Code Pro ExtraLight 最佳答案编辑
visual-studio-code - Visual Studio Code 断点警告 : The source code is different from the original version
我对 Visual Studio Code 很陌生。我正在尝试调试一个已经存在的应用程序，我已经通过 Git 克隆了它。我的文件都没有被修改。我已经下载了微软扩展“C# for Visual Stud
visual-studio-code - Visual Studio Code 和 Visual Studio Code Insider 之间有什么区别？
Visual Code VS Visual Studio Code Insider 我还是不明白这两者有什么区别，难道其中一个是新功能的试用版吗？最佳答案 Visual Studio Code In

首页

博学

6Ren·AI

商城

java.lang.IllegalArgumentException : Attempt to add ([custom-jar-with-spark-code]. jar) 多次到分布式缓存