gpt4 book ai didi

hadoop - 在 spark 集群模式下运行 zeppelin

转载 作者:可可西里 更新时间:2023-11-01 14:51:27 26 4
gpt4 key购买 nike

我正在使用本教程 spark cluster on yarn mode in docker container以 yarn 模式在 spark 集群中启动 zeppelin。但是我卡在了第 4 步。我在我的 docker 容器中找不到 conf/zeppelin-env.sh 来进行进一步的配置。我尝试将这些 conf 文件夹放入 zeppelin,但现在成功了。除此之外,zeppelin notebook 也没有在 localhost:9001 上运行。

我是分布式系统的新手,如果有人能帮助我以 yarn 模式在 spark 集群上启动 zeppelin,那就太好了。

这是我的 docker-compose 文件,用于启用 zeppelin 与 spark 集群的对话。

version: '2'
services:
sparkmaster:
build: .
container_name: sparkmaster
ports:
- "8080:8080"
- "7077:7077"
- "8888:8888"
- "8081:8081"
- "8082:8082"
- "5050:5050"
- "5051:5051"
- "4040:4040"
zeppelin:
image: dylanmei/zeppelin
container_name: zeppelin-notebook
env_file:
- ./hadoop.env
environment:
ZEPPELIN_PORT: 9001
CORE_CONF_fs_defaultFS: "hdfs://namenode:8020"
HADOOP_CONF_DIR_fs_defaultFS: "hdfs://namenode:8020"
SPARK_MASTER: "spark://spark-master:7077"
MASTER: "yarn-client"
SPARK_HOME: spark-master
ZEPPELIN_JAVA_OPTS: >-
-Dspark.driver.memory=1g
-Dspark.executor.memory=2g
ports:
- 9001:9001
volumes:
- ./data:/usr/zeppelin/data
- ./notebooks:/usr/zeppelin/notebook

最佳答案

这是您用来启动独立 spark 集群的 dockerfile。

但是容器内没有Zeppelin实例,所以你必须在本地机器上使用Zeppelin。

download并使用它。

关于hadoop - 在 spark 集群模式下运行 zeppelin,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/46149472/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com