作者热门文章
- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我有以下场景:
/user/lib/spark
中)和 HADOOP_CONF_DIR
(在 /etc/hadoop/conf
中) EMR 集群的主节点转移到我公司的服务器上,但 Spark 不识别 YARN。谢谢。
编辑:将主题行和正文中的“驱动程序”更改为“客户”。
最佳答案
这在独立模式下是可能的,但在 yarn 模式下是不可能的。
当 spark 在 yarn 模式下运行时,它无法控制 executor、AM 和 driver 的位置。
Yarn 检查每个任务节点上的内存使用情况和数据可用性,并在理想情况下旋转这些组件。
因此,即使您设法将外部节点添加到 yarn(显然您可以这样做),也只需设置适当的配置并在 yarn 的资源管理器上运行 admin refresh。但是,您也无法确定您的 Spark 驱动程序将在何处运行。
更新完全有可能做到这一点。以下是您需要做的事情。
Livy 服务器将位于 AWS 的开放端口上,您的本地系统或外部节点可以与之通信。 Hue 或 Zappelin 可以在您的外部节点上。
关于apache-spark - 在 EMR 集群外运行 Spark Client 并连接到 YARN,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/41001786/
我是一名优秀的程序员,十分优秀!