gpt4 book ai didi

apache-spark - Pyspark 在 yarn 集群模式下将文件写入本地

转载 作者:可可西里 更新时间:2023-11-01 14:55:23 25 4
gpt4 key购买 nike

我正在尝试运行我的 pyspark 代码。我的目标目录是本地目录。我提交 spark-submit 命令的用户是 super 用户,拥有从 hdfs 读取文件并将文件写入本地的所有权限。

作业正在运行,没有任何错误,但没有创建输出目录或文件。

我在我的 spark 代码中将 HADOOP_USER_NAME 设置为 super 用户以避免权限问题。

谁能帮忙

最佳答案

如果您在 YARN 集群模式下运行,那么 YARN ApplicationMaster 实际上是在一个节点上运行,因此将在节点本地写出。如果你找到它是哪个节点,那么你应该在那里找到你的输出目录和文件。

关于apache-spark - Pyspark 在 yarn 集群模式下将文件写入本地,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/57056255/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com