gpt4 book ai didi

java - 如何在 Cloudera 中安排/触发 Spark 作业?

转载 作者:可可西里 更新时间:2023-11-01 16:35:42 25 4
gpt4 key购买 nike

目前我们的项目在 MR 上,我们使用 Oozie 来编排我们的 MR 作业。现在我们正在转向 Spark,并且想知道在 CDH 集群上调度/触发 Spark 作业的推荐方法。请注意,CDH Oozie 不支持 Spark2 作业。所以请为此提供一个替代方案。

最佳答案

我上次查看时,Hue 在 Worlflow 编辑器中有一个 Spark 选项。如果 Cloudera 不支持它,我不确定它为什么会在那里......

虽然 CDH Oozie 确实支持纯 shell 脚本,但您需要确保所有 NodeManager 都将在本地服务器上提供可用的 spark-submit 命令。

如果这不起作用,它还支持用于运行 JAR 的 Java 操作,因此您可以编写您的 Spark 脚本,所有这些脚本都以从那里加载任何配置的 main 方法开始

关于java - 如何在 Cloudera 中安排/触发 Spark 作业?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/53387011/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com