python - key 错误 : SPARK_HOME during SparkConf initialization-6ren

python - key 错误 : SPARK_HOME during SparkConf initialization

转载作者：太空宇宙更新时间：2023-11-03 12:38:52

25

4

我是 spark 新手，我想从命令行运行 Python 脚本。我已经交互式地测试了 pyspark 并且它有效。尝试创建 sc 时出现此错误:

File "test.py", line 10, in <module>
    conf=(SparkConf().setMaster('local').setAppName('a').setSparkHome('/home/dirk/spark-1.4.1-bin-hadoop2.6/bin'))
  File "/home/dirk/spark-1.4.1-bin-hadoop2.6/python/pyspark/conf.py", line 104, in __init__
    SparkContext._ensure_initialized()
  File "/home/dirk/spark-1.4.1-bin-hadoop2.6/python/pyspark/context.py", line 229, in _ensure_initialized
    SparkContext._gateway = gateway or launch_gateway()
  File "/home/dirk/spark-1.4.1-bin-hadoop2.6/python/pyspark/java_gateway.py", line 48, in launch_gateway
    SPARK_HOME = os.environ["SPARK_HOME"]
  File "/usr/lib/python2.7/UserDict.py", line 23, in __getitem__
    raise KeyError(key)
KeyError: 'SPARK_HOME'

最佳答案

这里好像有两个问题。

第一个是您使用的路径。 SPARK_HOME 应该指向 Spark 安装的根目录，所以在你的情况下它应该是 /home/dirk/spark-1.4.1-bin-hadoop2.6 而不是/home/dirk/spark-1.4.1-bin-hadoop2.6/bin.

第二个问题是如何使用 setSparkHome。如果你检查 a docstring它的目标是

set path where Spark is installed on worker nodes

SparkConf 构造函数假定 master 上的 SPARK_HOME 已经设置。 It calls pyspark.context.SparkContext._ensure_initialized which calls pyspark.java_gateway.launch_gateway，which tries to acccess SPARK_HOME 失败。

要解决这个问题，您应该在创建 SparkConf 之前设置 SPARK_HOME。

import os
os.environ["SPARK_HOME"] = "/home/dirk/spark-1.4.1-bin-hadoop2.6"
conf = (SparkConf().setMaster('local').setAppName('a'))

关于python - key 错误 : SPARK_HOME during SparkConf initialization，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/31566250/

25

4

0

文章推荐： python - 从变量渲染 HTML 标签而不转义

文章推荐： SSL 是一半对称一半不对称？

文章推荐： ruby-on-rails - 缺少 Websocket header

文章推荐： Android GridView 适合列

ubuntu - pyspark 找不到有效的 SPARK_HOME
在尝试设置和运行 pyspark 时，我收到以下错误: tom@tom-OptiPlex-3060:~$ pyspark Could not find valid SPARK_HOME while s
python - pyspark:找不到有效的 SPARK_HOME
通过 pip install pyspark 全新安装 pyspark 后，出现以下错误: > pyspark Could not find valid SPARK_HOME while search
python - 将 `SPARK_HOME` 设置为什么？
安装了 apache-maven-3.3.3，scala 2.11.6，然后运行: $ git clone git://github.com/apache/spark.git -b branch-1.
python - key 错误 : 'SPARK_HOME' in pyspark
当我尝试时: from pyspark import SparkContext, SparkConf sc=SparkContext() 我得到: KeyError: 'SPARK_HOME' 解决方
docker - 使用 Kubernetes 的齐柏林飞艇。非本地模式的解释器设置中未指定 SPARK_HOME
我在 Kubernetes 集群(Minikube)中有一个 Spark 集群(Master + 2 Workers)。我想在我的 k8s 集群中添加 Zeppelin 并将其配置为使用我的 Spa
ubuntu - 路径问题 : Could not find valid SPARK_HOME while searching
我将我的 PATH 更新为如下所示: PATH="$HOME/bin:$HOME/.local/bin:$PATH:/home/username/Installs/Spark/bin" 我认为它起作用
python - key 错误 : SPARK_HOME during SparkConf initialization
我是 spark 新手，我想从命令行运行 Python 脚本。我已经交互式地测试了 pyspark 并且它有效。尝试创建 sc 时出现此错误: File "test.py", line 10, in
python - 无法在本地运行 python -m unittest。 SPARK_HOME 变量设置不正确
我想在将所有测试模块上传到 Jenkins 构建之前一起运行它们，所以我使用 python -m unittest tests/*.py 我的 devops-config.yml 文件中的命令。但我
hadoop - $SPARK_HOME 中包含的 hive-site.xml 是什么样的？
我是 hive 的初学者，当我启动 spark 作业并从 hive 读取数据时发生了一些事情(找不到表)。我没有在 $SPARK_HOME/conf 中设置 hive-site.xml 吗？提交sp
hadoop - 错误 spark-shell，回退到在 SPARK_HOME 下上传库
我正在尝试连接一个 spark-shell amazon hadoop，但我总是出现以下错误并且不知道如何修复它或配置缺少的内容。 spark.yarn.jars, spark.yarn.archiv
python - 错误 : Unable to find py4j, 您的 SPARK_HOME 可能未正确配置
我无法在 Jupyter 笔记本中的导入下运行。 findspark.init('home/ubuntu/spark-3.0.0-bin-hadoop3.2') 收到以下错误: -------

首页

博学

6Ren·AI

商城

python - key 错误 : SPARK_HOME during SparkConf initialization