gpt4 book ai didi

python - 在 hadoop 和 yarn 上安装 pyspark

转载 作者:可可西里 更新时间:2023-11-01 17:00:36 29 4
gpt4 key购买 nike

我在 hadoopyarn 上安装了 spark。当我启动 pyspark shell 并尝试计算一些东西时,我得到了这个错误。

Error from python worker:
/usr/bin/python: No module named pyspark

pyspark 模块应该在那里,我是否必须放置一个外部链接到它?

最佳答案

我遇到了同样的问题。这是由于使用 Java7 构建 Spark。使用 Java6 应该可以修复它。这实际上是python的错——它的zipimport模块不支持Java7使用的Zip64格式来打包包含65536+文件的大Jar。这是帮助我的谷歌热搜。 http://mail-archives.apache.org/mod_mbox/incubator-spark-user/201406.mbox/%3CCAMJOb8kcGk0PqiOGJu6UoKCeysWCuSW3xwd5wRs8ikpMgD2DAg@mail.gmail.com%3E

这也说明了。 https://issues.apache.org/jira/browse/SPARK-1911

关于python - 在 hadoop 和 yarn 上安装 pyspark,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/24462321/

29 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com