gpt4 book ai didi

python - 没有模块名称pyspark错误

转载 作者:太空狗 更新时间:2023-10-29 18:18:34 24 4
gpt4 key购买 nike

这是我正在学习的教程中的确切代码。我的同学用同样的代码没有得到这个错误:

ImportError                                Traceback (most recent call last)

<ipython-input-1-c6e1bed850ab> in <module>()
----> 1 from pyspark import SparkContext
2 sc = SparkContext('local', 'Exam_3')
3
4 from pyspark.sql import SQLContext
5 sqlContext = SQLContext(sc)

ImportError: No module named pyspark

这是代码:

from pyspark import SparkContext
sc = SparkContext('local', 'Exam_3')
from pyspark.sql import SQLContext
sqlContext = SQLContext(sc)
data = sc.textFile("exam3")
parsedData = data.map(lambda line: [float(x) for x in line.split(',')])
retail = sqlContext.createDataFrame(parsedData,
['category_name','product_id', 'product_name', 'product_price'])
retail.registerTempTable("exam3")
print parsedData.take(3)

最佳答案

您没有将 pyspark 安装在您正在使用的 python 安装可用的位置。要确认这一点,请在您的命令行终端上激活 virtualenv,输入您的 REPL (python) 并键入 import pyspark:

$ python
Python 3.5.0 (default, Dec 3 2015, 09:58:14)
[GCC 4.2.1 Compatible Apple LLVM 7.0.0 (clang-700.1.76)] on darwin
Type "help", "copyright", "credits" or "license" for more information.
>>> import pyspark
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
ImportError: No module named 'pyspark'

如果您看到 No module name 'pyspark' 导入错误,您需要安装该库。退出 REPL 并输入:

pip install pyspark

然后重新输入 repl 以确认它有效:

$ python
Python 3.5.0 (default, Dec 3 2015, 09:58:14)
[GCC 4.2.1 Compatible Apple LLVM 7.0.0 (clang-700.1.76)] on darwin
Type "help", "copyright", "credits" or "license" for more information.
>>> import pyspark
>>>

请注意,激活虚拟环境至关重要。在您的虚拟环境目录中时:

$ source bin/activate

这些说明适用于基于 unix 的机器,对于 Windows 会有所不同。

关于python - 没有模块名称pyspark错误,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/34302314/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com