gpt4 book ai didi

python - 如何从Python脚本/代码调用Spark2-submit命令

转载 作者:太空宇宙 更新时间:2023-11-03 19:57:35 26 4
gpt4 key购买 nike

我是 Spark 新手,一无所知。我被要求调查现有计划并被赋予以下任务1)文件1.py2)文件2.py版本是Spark2.0在 file1.py 中 --> Spark 使用 SparkSession 启动。基本上,我必须从 file1.py 调用 file2.py。我怎样才能做到这一点?

在控制台中,我可以运行这些单独的文件,例如:Spark2-提交file1.pySpark2-提交file2.py运行良好。但以编程方式,如何从 file1.py 调用 file2.py。

最佳答案

您可以像这样在 shell 作业中设置依赖关系,尽管我没有运行脚本,但逻辑上是这样工作的。希望这会有所帮助。

#./bin/sh

echo "Spark Job started ..."

echo "First Spark script-1 started ..."

spark2-Submit file1.py

if [ $? -eq 0 ]; then
echo "First Spark script-1 ran successfully..."
echo "Second Spark script-2 started ..."
spark2-Submit file2.py
if [ $? -eq 0 ]; then
echo "Second Spark script-2 ran successfully..."
else
echo "Second Spark script-2 failed ..."
exit 1
else
echo "First Spark script-1 failed ..."
exit 1
fi

关于python - 如何从Python脚本/代码调用Spark2-submit命令,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/59459678/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com