apache-spark - 使用 spark-submit YARN 集群模式时缺少 hive-site-6ren

apache-spark - 使用 spark-submit YARN 集群模式时缺少 hive-site

转载作者：行者123 更新时间：2023-12-04 11:19:24

24

4

使用 HDP 2.5.3，我一直在尝试调试一些 YARN 容器类路径问题。

由于 HDP 包含 Spark 1.6 和 2.0.0，因此出现了一些冲突版本

我支持的用户可以成功地将 Spark2 与 YARN 中的 Hive 查询一起使用 client模式，但不是来自 cluster模式，他们会收到有关未找到表的错误，或类似的错误，因为未建立 Metastore 连接。

我猜想设置要么--driver-class-path /etc/spark2/conf:/etc/hive/conf或路过--files /etc/spark2/conf/hive-site.xml之后 spark-submit会工作，但为什么不hive-site.xml已经从 conf 加载文件夹？

根据Hortonworks docs ，说 hive-site应该放在$SPARK_HOME/conf ，而且是...

我看到hdfs-site.xml和 core-site.xml , 以及属于 HADOOP_CONF_DIR 的其他文件例如，这是来自 YARN UI 容器信息。

2232355    4 drwx------   2 yarn     hadoop       4096 Aug  2 21:59 ./__spark_conf__
2232379    4 -r-x------   1 yarn     hadoop       2358 Aug  2 21:59 ./__spark_conf__/topology_script.py
2232381    8 -r-x------   1 yarn     hadoop       4676 Aug  2 21:59 ./__spark_conf__/yarn-env.sh
2232392    4 -r-x------   1 yarn     hadoop        569 Aug  2 21:59 ./__spark_conf__/topology_mappings.data
2232398    4 -r-x------   1 yarn     hadoop        945 Aug  2 21:59 ./__spark_conf__/taskcontroller.cfg
2232356    4 -r-x------   1 yarn     hadoop        620 Aug  2 21:59 ./__spark_conf__/log4j.properties
2232382   12 -r-x------   1 yarn     hadoop       8960 Aug  2 21:59 ./__spark_conf__/hdfs-site.xml
2232371    4 -r-x------   1 yarn     hadoop       2090 Aug  2 21:59 ./__spark_conf__/hadoop-metrics2.properties
2232387    4 -r-x------   1 yarn     hadoop        662 Aug  2 21:59 ./__spark_conf__/mapred-env.sh
2232390    4 -r-x------   1 yarn     hadoop       1308 Aug  2 21:59 ./__spark_conf__/hadoop-policy.xml
2232399    4 -r-x------   1 yarn     hadoop       1480 Aug  2 21:59 ./__spark_conf__/__spark_conf__.properties
2232389    4 -r-x------   1 yarn     hadoop       1602 Aug  2 21:59 ./__spark_conf__/health_check
2232385    4 -r-x------   1 yarn     hadoop        913 Aug  2 21:59 ./__spark_conf__/rack_topology.data
2232377    4 -r-x------   1 yarn     hadoop       1484 Aug  2 21:59 ./__spark_conf__/ranger-hdfs-audit.xml
2232383    4 -r-x------   1 yarn     hadoop       1020 Aug  2 21:59 ./__spark_conf__/commons-logging.properties
2232357    8 -r-x------   1 yarn     hadoop       5721 Aug  2 21:59 ./__spark_conf__/hadoop-env.sh
2232391    4 -r-x------   1 yarn     hadoop        281 Aug  2 21:59 ./__spark_conf__/slaves
2232373    8 -r-x------   1 yarn     hadoop       6407 Aug  2 21:59 ./__spark_conf__/core-site.xml
2232393    4 -r-x------   1 yarn     hadoop        812 Aug  2 21:59 ./__spark_conf__/rack-topology.sh
2232394    4 -r-x------   1 yarn     hadoop       1044 Aug  2 21:59 ./__spark_conf__/ranger-hdfs-security.xml
2232395    8 -r-x------   1 yarn     hadoop       4956 Aug  2 21:59 ./__spark_conf__/metrics.properties
2232386    8 -r-x------   1 yarn     hadoop       4221 Aug  2 21:59 ./__spark_conf__/task-log4j.properties
2232380    4 -r-x------   1 yarn     hadoop         64 Aug  2 21:59 ./__spark_conf__/ranger-security.xml
2232372   20 -r-x------   1 yarn     hadoop      19975 Aug  2 21:59 ./__spark_conf__/yarn-site.xml
2232397    4 -r-x------   1 yarn     hadoop       1006 Aug  2 21:59 ./__spark_conf__/ranger-policymgr-ssl.xml
2232374    4 -r-x------   1 yarn     hadoop         29 Aug  2 21:59 ./__spark_conf__/yarn.exclude
2232384    4 -r-x------   1 yarn     hadoop       1606 Aug  2 21:59 ./__spark_conf__/container-executor.cfg
2232396    4 -r-x------   1 yarn     hadoop       1000 Aug  2 21:59 ./__spark_conf__/ssl-server.xml
2232375    4 -r-x------   1 yarn     hadoop          1 Aug  2 21:59 ./__spark_conf__/dfs.exclude
2232359    8 -r-x------   1 yarn     hadoop       7660 Aug  2 21:59 ./__spark_conf__/mapred-site.xml
2232378   16 -r-x------   1 yarn     hadoop      14474 Aug  2 21:59 ./__spark_conf__/capacity-scheduler.xml
2232376    4 -r-x------   1 yarn     hadoop        884 Aug  2 21:59 ./__spark_conf__/ssl-client.xml

如您所见， hive-site不在那里，尽管我肯定有 conf/hive-site.xml用于 Spark 提交

[spark@asthad006 conf]$ pwd && ls -l
/usr/hdp/2.5.3.0-37/spark2/conf
total 32
-rw-r--r-- 1 spark spark   742 Mar  6 15:20 hive-site.xml
-rw-r--r-- 1 spark spark   620 Mar  6 15:20 log4j.properties
-rw-r--r-- 1 spark spark  4956 Mar  6 15:20 metrics.properties
-rw-r--r-- 1 spark spark   824 Aug  2 22:24 spark-defaults.conf
-rw-r--r-- 1 spark spark  1820 Aug  2 22:24 spark-env.sh
-rwxr-xr-x 1 spark spark   244 Mar  6 15:20 spark-thrift-fairscheduler.xml
-rw-r--r-- 1 hive  hadoop  918 Aug  2 22:24 spark-thrift-sparkconf.conf

所以，我认为我不应该将 hive-site 放在 HADOOP_CONF_DIR 中。如 HIVE_CONF_DIR是分开的，但我的问题是我们如何让 Spark2 拿起 hive-site.xml无需在运行时手动将其作为参数传递？

编辑当然，由于我使用的是 HDP，因此我使用的是 Ambari。之前的集群管理员已经在所有机器上安装了 Spark2 客户端，因此所有可能是潜在 Spark 驱动程序的 YARN NodeManager 都应该具有相同的配置文件

最佳答案

您可以使用 spark 属性 - spark.yarn.dist.files并在那里指定 hive-site.xml 的路径。

关于apache-spark - 使用 spark-submit YARN 集群模式时缺少 hive-site，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/45477155/

24

4

0

文章推荐： json - Play Framework JSON读取: How to read either String or Int?

文章推荐： visual-studio-2015 - 部分取消搁置 TFS 搁架集

文章推荐： c - '- 使用了 >' operator in C and how it'

文章推荐： scala - 如何访问案例类字段字段的字符串名称中的值

javascript - querySelector 似乎正在从输入 id "#submit"和另一个输入类型 ="submit"识别 ="submit"
我创建了一个函数来在两个元素的 style.display 之间切换为“none”或“block”。我在这里遇到的问题是“发送”按钮似乎与“切换”按钮具有相同的行为。这不是我指定它要做的事情。我想知道
jquery - 为什么表单操作页中的结构键值显示两次，如 "Submit,Submit"？
当我使用 validate.js 添加表单验证时，其验证正常并显示验证消息。但输入 type="submit"值在操作页面结构中显示两次。为了说明，我有两个 .cfm 文件，index.cfm 具有
java - sj :submit and s:submit on the same form
我有一个 s:form，里面有 sj:submit 和 s:submit，sj:submit 工作正常，但 s:submit 按钮不起作用。当我点击 s:submit 按钮时没有任何反应。我尝试在表
jquery - 为什么不通过表单元素上的 Submit 方法提交表单调用 $.submit 处理程序？
参见http://jsfiddle.net/8KNc7/5/有关我正在讨论的内容的工作示例(目前在 Firefox 15 中进行测试，尚未尝试其他版本)。我有一个带有 submit 输入和 butt
javascript - form.submit() 和输入类型为 "submit"之间的区别
我有一个包含表单的 HTML 页面。我想做一些字段 "required" 。问题是我没有使用在我的表单中，我使用 Javascript 函数来提交表单，因为我需要将 Javascript 变量发送到
php - 使用什么代替 if(isset($_POST ['submit' ])) for this.form.submit()？
如果用户提交表单，我想运行特定的 PHP block 。如果我使用带有 name="submit"的提交按钮并且: 我对 javascript 一无所知，我希望代码在用户更改下拉菜单时运行。如果我将
javascript - 区分 HTML 表单 SUBMIT 和基于控制台的表单 SUBMIT
我有一个网站 www.abc.com，其中有一个页面 xyz.php。 xyz.php 采用表单提交事件读取数据并保存在数据库中。 www.abc.com 有一个针对 xyz.php 执行操作的表单。
javascript - 使用javascript自动填充 "form"和 "submit"而不按 "submit"
这个问题在这里已经有了答案: JavaScript post request like a form submit (32 个答案) 关闭 9 年前。我查看了不同的线程，但找不到合适的解决方案。
javascript - form.on ('submit' ) 不会在 form.submit() 之前触发
我有一个表单提交触发器和一个确认引导框，它显示在单击表单提交按钮上。在 bootbox 中确认如果用户同意我提交表单。我的问题是 onsubmit 在用户说是之前触发，并且当我在 bootbox 中调
javascript - 为什么 form.submit() 不会触发 "submit"事件？
我正在使用 JavaScript .submit() 函数提交我的表单。 form.submit(); 但是当我使用 addEventListener 来捕获我的提交事件时，它不起作用。 form.a
javascript - 输入类型="submit"，onclick处理程序调用this.form.submit()，并且不返回任何值
编辑:在考虑回答问题之前，请仔细阅读问题的所有内容。我既不是在生产代码中使用内联事件处理程序的可取性，也不是在实现我所引用的文章所 promise 的结果的最佳方法。这是关于Javascript语义和
jQuery:表单未使用 $ ("#id").submit() 提交，但会使用 'submit' 按钮提交？
这是我的形式，对我来说看起来不错。在这种形式中，我放置了这个按钮: 这是它调用的函数: function confirmSubmit() { // get the number of st
css - 哪个更快？输入[类型 ="submit"] 或 [类型 ="submit"]
以下哪个 CSS 选择器更快？ input[type="submit"] { /* styles */ } 或 [type="submit"] { /* styles */ } 只是好
javascript - html 表单按钮 vs 输入类型 ="submit"vs this.submit()？
在表单上添加提交按钮的符合标准的正确语义方式是什么？我不需要按钮中的图像或背景，只需要简单的文本，也许是带弯 Angular 的渐变背景(使用 CSS3)。这些是我所知道的方法: click her
javascript - 为什么 ng-submit 没有触发 $scope.submit 函数？
我的 App.js 包含以下代码: var app = angular.module('githubApp', []); 我有 githubAppController 和以下代码: app.contr
javascript - jQuery 方法 : difference between . submit() 与 .trigger ('submit' )
jQuery 允许通过以下任一方式以编程方式触发表单提交: $('.js-form-class-hook').submit(); $('.js-form-class-hook').trigger('s
javascript - HTML Javascript，.click()->.submit() 和 .submit() 返回不同的结果
我有一个表单，其中一个按钮使用 onClick 事件提交。 " 此外，我有一个输入，当输入处于焦点状态时按下回车键时会触发 couponButton。虽然它们都触发相同的事件 (.submit()
javascript - 按钮与输入类型 ="submit"与 onclick ="document.formname.submit()"
目前只是尝试实现这些按钮:http://web.archive.org/web/20110721191046/http://particletree.com/features/rediscoverin
ios - 在TestFlight中点击 "Submit for Review"后，status还是 "Ready to Submit"
我正在提交我的第一个构建以供 TestFlight beta 审查，在创建一个组后，添加 4 名团队成员添加我的构建，取消单击该框以表示我需要登录信息来测试该应用程序，我单击“提交”审查。” iTun
javascript - 是否可以在任何现有的 onsubmit/submit 之前绑定(bind) submit() 函数？
我有一个带有 onsubmit 属性的表单。我需要绑定(bind)一个新的提交事件，并且我需要在任何现有提交函数之前执行此事件。下面的代码演示了这个问题。 Test

首页

博学

6Ren·AI

商城

apache-spark - 使用 spark-submit YARN 集群模式时缺少 hive-site