gpt4 book ai didi

apache-spark - Spark 从多个配置文件加载设置

转载 作者:行者123 更新时间:2023-12-04 05:27:37 24 4
gpt4 key购买 nike

Spark 从 $SPARK_HOME/conf/spark-defaults.conf 读取默认配置.

您还可以使用 --properties-file [FILE] 更改默认位置。使用(例如)时的命令行参数 spark-submit .

我想要做的是从文件加载额外的参数,而不必替换默认参数。也就是说,我希望 spark 从 spark-defaults.conf 加载属性并从另一个文件加载更多属性。现在,如果两者都定义了属性,我希望最后一个配置文件获胜。

这在 Spark 中是否默认支持?

最佳答案

tl;博士没有。

如 Spark documentation 中所述,这是配置的优先顺序:

“直接在 SparkConf 上设置的属性具有最高优先级,然后标志传递给 spark-submit 或 spark-shell,然后是 spark-defaults.conf 文件中的选项。”

鉴于此,我会使用 Typesafe Config在我的驱动程序代码中加载自定义配置文件并设置我直接在 SparkConf 上找到的任何内容.在那里设置的任何内容都将优先于其他地方的任何先前配置。

关于apache-spark - Spark 从多个配置文件加载设置,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/43358834/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com