gpt4 book ai didi

python - 无法导入 SparkContext

转载 作者:太空宇宙 更新时间:2023-11-04 10:01:58 26 4
gpt4 key购买 nike

我在 CentOS 上工作,我已经设置了 $SPARK_HOME 并且还在 $PATH 中添加了 bin 的路径。

我可以从任何地方运行 pyspark

但是当我尝试创建 python 文件并使用此语句时;

from pyspark import SparkConf, SparkContext

它抛出以下错误

python pysparktask.py
Traceback (most recent call last):
File "pysparktask.py", line 1, in <module>
from pyspark import SparkConf, SparkContext
ModuleNotFoundError: No module named 'pyspark'

我尝试使用 pip 再次安装它。

pip install pyspark

它也给出了这个错误。

Could not find a version that satisfies the requirement pyspark (from versions: ) No matching distribution found for pyspark

编辑

根据答案,我更新了代码。

错误是

Traceback (most recent call last):
File "pysparktask.py", line 6, in <module>
from pyspark import SparkConf, SparkContext
File "/opt/mapr/spark/spark-2.0.1/python/pyspark/__init__.py", line 44, in <module>
from pyspark.context import SparkContext
File "/opt/mapr/spark/spark-2.0.1/python/pyspark/context.py", line 33, in <module>
from pyspark.java_gateway import launch_gateway
File "/opt/mapr/spark/spark-2.0.1/python/pyspark/java_gateway.py", line 31, in <module>
from py4j.java_gateway import java_import, JavaGateway, GatewayClient
ModuleNotFoundError: No module named 'py4j'

最佳答案

添加如下环境变量,同时将spark的lib路径追加到sys.path中

import os
import sys

os.environ['SPARK_HOME'] = "/usr/lib/spark/"
sys.path.append("/usr/lib/spark/python/")

from pyspark import SparkConf, SparkContext # And then try to import SparkContext.

关于python - 无法导入 SparkContext,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/43126547/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com