gpt4 book ai didi

Hadoop YARN 集群性能调优

转载 作者:可可西里 更新时间:2023-11-01 16:50:38 26 4
gpt4 key购买 nike

enter image description here

我想知道一些参数来加速我的 YARN 集群上的 Spark 作业。

我有以下 Spark/YARN 配置,但我对执行速度不满意。我有很多未使用的 vcores 和内存。

Spark 配置:

- spark.yarn.am.cores = 2
- spark.executor.memory = 5g
- spark.executor.cores = 8

yarn 配置:

- yarn.nodemanager.resource.memory-mb = 31744
- yarn.nodemanager.resource.cpu-vcores = 15
- yarn.scheduler.maximum-allocation-mb = 31744

从图片来看,

  1. 在节点 3 和 5 上,为什么使用 2GB 中的 6GB。
  2. 节点 1、2、4、5、6 上的内 stub 本没有使用

此外,我希望能够在集群中的每个节点上启动更多容器。

非常感谢帮助。

最佳答案

添加这个 spark conf,成功了:

spark.executor.instances = 6

enter image description here

关于Hadoop YARN 集群性能调优,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/33603518/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com