gpt4 book ai didi

hadoop - Hadoop(EMR)Cluster Fair Scheduler正在完成FIFO而不是并行执行

转载 作者:行者123 更新时间:2023-12-02 19:20:28 24 4
gpt4 key购买 nike

这是我第一次尝试配置YARN调度程序,但无法正常运行。该群集最初用作FIFO,而我正在尝试使作业并行运行。我已经添加到yarn-site.xml的顶部

  <property>
<name>yarn.resourcemanager.scheduler.class</name>
<value>org.apache.hadoop.yarn.server.resourcemanager.scheduler.fair.FairScheduler</value>
</property>


<property>
<name>yarn.scheduler.fair.allocation.file</name>
<value>/etc/hadoop/conf.empty/fair-scheduler.xml</value>
</property>

然后添加文件/etc/hadoop/conf.empty/fair-scheduler.xml:
<allocations>
<queue name="root">
<weight>1.0</weight>
<schedulingPolicy>fair</schedulingPolicy>
<aclSubmitApps> </aclSubmitApps>
<aclAdministerApps>*</aclAdministerApps>
</queue>
<defaultQueueSchedulingPolicy>fair</defaultQueueSchedulingPolicy>
<queuePlacementPolicy>
<rule name="specified" create="true"/>
<rule name="user" create="true"/>
</queuePlacementPolicy>
</allocations>

因此,在此之后,我停止并启动了 yarn 资源管理器,并在YARN Application控制台上看到了Fair Scheduler!但是,当尝试在集群上运行多个作业时,AWS EMR控制台仅显示一个正在运行的作业,另外两个正在等待处理。此外,YARN控制台仅显示队列root.hadoop中正在运行的一个作业,而看不到其他作业(该作业完成后将运行)。

那么,如何才能使这些作业并行运行?

最佳答案

实际上,可以通过yarn-site.xml设置调度程序。如果您拉起YARN资源管理器,则调度程序实际上将显示更改,但是问题在于提交AWS EMR步骤时。 EMR步骤本质上是按顺序运行的,这意味着在上一步完成之前,AWS不会将下一个作业提交给YARN。因此,必须将工作直接提交给Yarn才能看到好处。但是,EMR步骤似乎最近已改变。如果使用EMR版本5.28.0,则AWS EMR现在支持并行步骤执行:https://aws.amazon.com/about-aws/whats-new/2019/11/amazon-emr-now-allows-you-to-run-multiple-steps-in-parallel-cancel-running-steps-and-integrate-with-aws-step-functions/

关于hadoop - Hadoop(EMR)Cluster Fair Scheduler正在完成FIFO而不是并行执行,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/47044837/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com