gpt4 book ai didi

apache-spark - yarn 容量调度器 : Share resource between users and queues

转载 作者:可可西里 更新时间:2023-11-01 14:30:14 26 4
gpt4 key购买 nike

我在设置以下调度程序队列参数时遇到了一些问题:

有 2 个队列 Dev 和 Prod

  • 根 100%

    • 开发 30%

    • 生产率 70%

(如果只有一个使用它应该充当 100% 的集群)

每个队列由多个用户使用,资源应该被平均共享,但是当只有一个用户存在时(在每个队列中)它应该使用队列的全部容量。如果用户单独在集群中,它应该使用 100% 的集群以防第二个用户加入,调度程序应该共享可用资源

我现在有什么,示例流程:

  1. 集群没有作业

  2. 用户队列 Dev 中的提交作业。 (它现在使用 100% 的集群)

  3. 用户 B 在队列 Dev 提交作业(它卡在已接受并等待第一个作业完成)

我想要什么:

在这种情况下,因为第二个作业在同一个队列中,每个作业都应该接收队列的 50%,即集群的 100%。

然后如果另一个作业进入 Prod 队列(Prod 上的 2 个作业将共享 70%(每个 35%),Dev 上的一个作业将共享 30%)

在另一种情况下,如果作业进入另一个队列(总共 1 个),则容量应为 30,70

基于 Apache Ambari

版本 2.6.1.5

最佳答案

作业 B 必须等待作业 A 完成。据我所知,没有办法在同一个 YARN 队列上重新分配负载。

如果您启用了抢占 (https://docs.hortonworks.com/HDPDocuments/HDP2/HDP-2.6.5/bk_yarn-resource-management/content/preemption.html),生产作业将被优先考虑并且应该占用 70% 的资源。至于开发队列,先进先出..

关于apache-spark - yarn 容量调度器 : Share resource between users and queues,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/50946734/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com