scala - 如何使用Docker将参数传递给Spark-Submit-6ren

scala - 如何使用Docker将参数传递给Spark-Submit

转载作者：行者123 更新时间：2023-12-02 19:27:08

24

4

我的笔记本电脑上有一个Docker容器，其中有一个主机和三个 worker ，我可以使用以下命令输入主机的ip来启动典型的wordcount示例:

bash-4.3# spark/bin/spark-submit --class com.oreilly.learningsparkexamples.mini.scala.WordCount --master spark://spark-master:7077 /opt/spark-apps/learning-spark-mini-example_2.11-0.0.1.jar /opt/spark-data/README.md /opt/spark-data/output-5

我可以看到在output-5内如何生成文件

但是，当我尝试使用以下命令从外部启动该进程时:

docker run --network docker-spark-cluster_spark-network -v /tmp/spark-apps:/opt/spark-apps --env SPARK_APPLICATION_JAR_LOCATION=$SPARK_APPLICATION_JAR_LOCATION --env SPARK_APPLICATION_MAIN_CLASS=$SPARK_APPLICATION_MAIN_CLASS -e APP_ARGS="/opt/spark-data/README.md /opt/spark-data/output-5" spark-submit:2.4.0

哪里

echo $SPARK_APPLICATION_JAR_LOCATION
/opt/spark-apps/learning-spark-mini-example_2.11-0.0.1.jar

echo $SPARK_APPLICATION_MAIN_CLASS
com.oreilly.learningsparkexamples.mini.scala.WordCount

当我进入尝试执行任务的工作人员页面时，可以看到在第11行中，首先是收集第一个参数的路径的地方，我遇到了这样的错误:

Caused by: java.lang.ArrayIndexOutOfBoundsException: 0
    at com.oreilly.learningsparkexamples.mini.scala.WordCount$.main(WordCount.scala:11)

显然，在零位置处不收集第一个参数的路径，我要对其进行单词计数的输入文件之一。

问题是，为什么 docker 不使用通过-e APP_ARGS =“/ opt / spark-data / README.md / opt / spark-data-output-5”传递的参数？

我已经尝试过以传统方式运行该作业，登录驱动程序spark-master并运行spark-submit命令，但是当我尝试使用docker运行任务时，它不起作用。

它一定是微不足道的，但我仍然有任何线索。有谁能够帮助我？

解决了

我必须使用这样的命令:

docker run --network docker-spark-cluster_spark-network -v /tmp/spark-apps:/opt/spark-apps --env SPARK_APPLICATION_JAR_LOCATION=$SPARK_APPLICATION_JAR_LOCATION --env SPARK_APPLICATION_MAIN_CLASS=$SPARK_APPLICATION_MAIN_CLASS --env SPARK_APPLICATION_ARGS="/opt/spark-data/README.md /opt/spark-data/output-6" spark-submit:2.4.0

继续，我必须将-e APP_ARGS更改为--env SPARK_APPLICATION_ARGS

-e APP_ARGS是建议的docker方式...

最佳答案

这是解决我的问题的命令:

docker run --network docker-spark-cluster_spark-network -v /tmp/spark-apps:/opt/spark-apps --env SPARK_APPLICATION_JAR_LOCATION=$SPARK_APPLICATION_JAR_LOCATION --env SPARK_APPLICATION_MAIN_CLASS=$SPARK_APPLICATION_MAIN_CLASS --env SPARK_APPLICATION_ARGS="/opt/spark-data/README.md /opt/spark-data/output-6" spark-submit:2.4.0

我必须使用--env SPARK_APPLICATION_ARGS =“args1 args2 argsN”代替-e APP_ARGS =“args1 args2 argsN”。

关于scala - 如何使用Docker将参数传递给Spark-Submit，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/55242533/

24

4

0

文章推荐： spring - 在Docker容器中运行时找不到Eureka服务

文章推荐： docker - 如何防止重定向的docker端口向外界开放？

文章推荐： python - 在 docker 环境中 pip install git+url

文章推荐： python - 使用python从Hive检索数据时出错

javascript - querySelector 似乎正在从输入 id "#submit"和另一个输入类型 ="submit"识别 ="submit"
我创建了一个函数来在两个元素的 style.display 之间切换为“none”或“block”。我在这里遇到的问题是“发送”按钮似乎与“切换”按钮具有相同的行为。这不是我指定它要做的事情。我想知道
jquery - 为什么表单操作页中的结构键值显示两次，如 "Submit,Submit"？
当我使用 validate.js 添加表单验证时，其验证正常并显示验证消息。但输入 type="submit"值在操作页面结构中显示两次。为了说明，我有两个 .cfm 文件，index.cfm 具有
java - sj :submit and s:submit on the same form
我有一个 s:form，里面有 sj:submit 和 s:submit，sj:submit 工作正常，但 s:submit 按钮不起作用。当我点击 s:submit 按钮时没有任何反应。我尝试在表
jquery - 为什么不通过表单元素上的 Submit 方法提交表单调用 $.submit 处理程序？
参见http://jsfiddle.net/8KNc7/5/有关我正在讨论的内容的工作示例(目前在 Firefox 15 中进行测试，尚未尝试其他版本)。我有一个带有 submit 输入和 butt
javascript - form.submit() 和输入类型为 "submit"之间的区别
我有一个包含表单的 HTML 页面。我想做一些字段 "required" 。问题是我没有使用在我的表单中，我使用 Javascript 函数来提交表单，因为我需要将 Javascript 变量发送到
php - 使用什么代替 if(isset($_POST ['submit' ])) for this.form.submit()？
如果用户提交表单，我想运行特定的 PHP block 。如果我使用带有 name="submit"的提交按钮并且: 我对 javascript 一无所知，我希望代码在用户更改下拉菜单时运行。如果我将
javascript - 区分 HTML 表单 SUBMIT 和基于控制台的表单 SUBMIT
我有一个网站 www.abc.com，其中有一个页面 xyz.php。 xyz.php 采用表单提交事件读取数据并保存在数据库中。 www.abc.com 有一个针对 xyz.php 执行操作的表单。
javascript - 使用javascript自动填充 "form"和 "submit"而不按 "submit"
这个问题在这里已经有了答案: JavaScript post request like a form submit (32 个答案) 关闭 9 年前。我查看了不同的线程，但找不到合适的解决方案。
javascript - form.on ('submit' ) 不会在 form.submit() 之前触发
我有一个表单提交触发器和一个确认引导框，它显示在单击表单提交按钮上。在 bootbox 中确认如果用户同意我提交表单。我的问题是 onsubmit 在用户说是之前触发，并且当我在 bootbox 中调
javascript - 为什么 form.submit() 不会触发 "submit"事件？
我正在使用 JavaScript .submit() 函数提交我的表单。 form.submit(); 但是当我使用 addEventListener 来捕获我的提交事件时，它不起作用。 form.a
javascript - 输入类型="submit"，onclick处理程序调用this.form.submit()，并且不返回任何值
编辑:在考虑回答问题之前，请仔细阅读问题的所有内容。我既不是在生产代码中使用内联事件处理程序的可取性，也不是在实现我所引用的文章所 promise 的结果的最佳方法。这是关于Javascript语义和
jQuery:表单未使用 $ ("#id").submit() 提交，但会使用 'submit' 按钮提交？
这是我的形式，对我来说看起来不错。在这种形式中，我放置了这个按钮: 这是它调用的函数: function confirmSubmit() { // get the number of st
css - 哪个更快？输入[类型 ="submit"] 或 [类型 ="submit"]
以下哪个 CSS 选择器更快？ input[type="submit"] { /* styles */ } 或 [type="submit"] { /* styles */ } 只是好
javascript - html 表单按钮 vs 输入类型 ="submit"vs this.submit()？
在表单上添加提交按钮的符合标准的正确语义方式是什么？我不需要按钮中的图像或背景，只需要简单的文本，也许是带弯 Angular 的渐变背景(使用 CSS3)。这些是我所知道的方法: click her
javascript - 为什么 ng-submit 没有触发 $scope.submit 函数？
我的 App.js 包含以下代码: var app = angular.module('githubApp', []); 我有 githubAppController 和以下代码: app.contr
javascript - jQuery 方法 : difference between . submit() 与 .trigger ('submit' )
jQuery 允许通过以下任一方式以编程方式触发表单提交: $('.js-form-class-hook').submit(); $('.js-form-class-hook').trigger('s
javascript - HTML Javascript，.click()->.submit() 和 .submit() 返回不同的结果
我有一个表单，其中一个按钮使用 onClick 事件提交。 " 此外，我有一个输入，当输入处于焦点状态时按下回车键时会触发 couponButton。虽然它们都触发相同的事件 (.submit()
javascript - 按钮与输入类型 ="submit"与 onclick ="document.formname.submit()"
目前只是尝试实现这些按钮:http://web.archive.org/web/20110721191046/http://particletree.com/features/rediscoverin
ios - 在TestFlight中点击 "Submit for Review"后，status还是 "Ready to Submit"
我正在提交我的第一个构建以供 TestFlight beta 审查，在创建一个组后，添加 4 名团队成员添加我的构建，取消单击该框以表示我需要登录信息来测试该应用程序，我单击“提交”审查。” iTun
javascript - 是否可以在任何现有的 onsubmit/submit 之前绑定(bind) submit() 函数？
我有一个带有 onsubmit 属性的表单。我需要绑定(bind)一个新的提交事件，并且我需要在任何现有提交函数之前执行此事件。下面的代码演示了这个问题。 Test

首页

博学

6Ren·AI

商城

scala - 如何使用Docker将参数传递给Spark-Submit