gpt4 book ai didi

python - 如何使用pycharm在远程spark集群中运行应用

转载 作者:行者123 更新时间:2023-12-04 15:38:43 27 4
gpt4 key购买 nike

我已经在本地系统上安装了 PyCharm,并将其配置为在 Windows 中以本地模式运行 spark 应用程序。

我的 spark 集群位于远程 Ubuntu 盒子中。

如何从本地安装的 Windows 上的 PyCharm 运行 Ubuntu 上的远程 spark 集群中的 spark 应用程序?

我的目标是在远程集群中运行应用程序,因此也欢迎使用变通方法。

最佳答案

PyCharm 已经为此设置好了。理想情况下,您希望为您的设置设置一个部署 和一个远程解释器,最好是通过ssh

这允许您将您的代码库上传到集群(以便 pyspark 驱动程序可以访问它),但可以从您的笔记本电脑上运行它。然后,远程解释器负责解决集群上的依赖关系。看这里https://www.jetbrains.com/help/pycharm/configuring-remote-interpreters-via-ssh.html在这里 https://www.jetbrains.com/help/pycharm/creating-a-remote-server-configuration.html .

注意:在开始配置远程解释器之前,最好在集群上安装 venvconda 并创建一个虚拟环境,这样您就没有任何依赖项或过时的包。然后将远程解释器配置指向环境的 python 二进制文件,例如 /app/anaconda3/envs/my_env/bin/python

关于python - 如何使用pycharm在远程spark集群中运行应用,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/58880817/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com