gpt4 book ai didi

python-3.x - 如何在 google 的 dataproc pyspark 上运行 python3

转载 作者:行者123 更新时间:2023-12-04 14:55:06 27 4
gpt4 key购买 nike

我想通过 Google Cloud Platform dataproc 运行 pyspark 作业,但我不知道如何设置 pyspark 以默认运行 python3 而不是 2.7。

我能找到的最好的是添加这些 initialization commands

但是,当我通过 ssh 进入集群时
(a) python命令还是python2,
(b) 由于 python 2 不兼容,我的工作失败了。

我试过卸载 python2 和别名 alias python='python3'在我的 init.sh 脚本中,但是,没有成功。别名似乎不成立。

我像这样创建集群

cluster_config = {
"projectId": self.project_id,
"clusterName": cluster_name,
"config": {
"gceClusterConfig": gce_cluster_config,
"masterConfig": master_config,
"workerConfig": worker_config,
"initializationActions": [
[{
"executableFile": executable_file_uri,
"executionTimeout": execution_timeout,
}]
],
}
}

credentials = GoogleCredentials.get_application_default()
api = build('dataproc', 'v1', credentials=credentials)

response = api.projects().regions().clusters().create(
projectId=self.project_id,
region=self.region, body=cluster_config
).execute()

我的 executable_file_uri位于谷歌存储上; init.sh :
apt-get -y update
apt-get install -y python-dev
wget -O /root/get-pip.py https://bootstrap.pypa.io/get-pip.py
python /root/get-pip.py
apt-get install -y python-pip
pip install --upgrade pip
pip install --upgrade six
pip install --upgrade gcloud
pip install --upgrade requests
pip install numpy

最佳答案

我找到了这个问题的答案 here这样我的初始化脚本现在看起来像这样:

#!/bin/bash

# Install tools
apt-get -y install python3 python-dev build-essential python3-pip
easy_install3 -U pip

# Install requirements
pip3 install --upgrade google-cloud==0.27.0
pip3 install --upgrade google-api-python-client==1.6.2
pip3 install --upgrade pytz==2013.7

# Setup python3 for Dataproc
echo "export PYSPARK_PYTHON=python3" | tee -a /etc/profile.d/spark_config.sh /etc/*bashrc /usr/lib/spark/conf/spark-env.sh
echo "export PYTHONHASHSEED=0" | tee -a /etc/profile.d/spark_config.sh /etc/*bashrc /usr/lib/spark/conf/spark-env.sh
echo "spark.executorEnv.PYTHONHASHSEED=0" >> /etc/spark/conf/spark-defaults.conf

关于python-3.x - 如何在 google 的 dataproc pyspark 上运行 python3,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/45843960/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com