gpt4 book ai didi

python - 如何安装/导入 pyspark-csv?

转载 作者:太空宇宙 更新时间:2023-11-04 03:29:21 25 4
gpt4 key购买 nike

我正在尝试在 PySpark 中使用来自 CSV 文件的数据。我找到了一个名为 PySpark-CSV 的模块,它完全可以满足我的需要。根据PySpark-CSV GitHub page ,“不需要安装 [is]”,所以我想我可以将源解压缩到我的 Python 路径中名为“pyspark_csv”的目录中,然后运行他们网站上列出的命令:

import pyspark_csv as pycsv
sc.addPyFile('pyspark_csv.py')

但这给我带来了一个导入错误,说它找不到 pyspark_csv。

自述文件对我没有任何帮助,其他信息也很少。这里有人熟悉该模块吗?

最佳答案

意思是Python找不到pyspark_csv.py。这是因为您将文件放在 pyspark_csv 中,而 Python 并不知道这一点。假设目录的完整路径是“/foo/pyspark_csv”。您可以修改 PYTHONPATH,或使用其他方法通知 Python 您将文件放在哪里。

#Run this in bash shell before you excute python
#Or put thisline in a bottom of .bashrc file.
export PYTHONPATH=$PYTHONPATH:/foo/pyspark_csv

也为 Spark 使用完整路径:

sc.addPyFile('/foo/pyspark_csv/pyspark_csv.py')

关于python - 如何安装/导入 pyspark-csv?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/31693348/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com