gpt4 book ai didi

hadoop - AM如何为每个约简任务选择节点?

转载 作者:行者123 更新时间:2023-12-02 20:33:20 24 4
gpt4 key购买 nike

我正在同一集群中执行两个Word计数示例作业(我使用多集群在本地运行hadoop 2.65),其中我的代码一个接一个地运行两个作业。
其中两个作业共享相同的映射器,化简器等,但是每个作业都有不同的分区器

为什么第二项作业的节点上的reduce任务分配不同?我正在通过节点的IP(Java getting my IP address)标识reduce任务节点。
我知道这些键会去执行其他的reduce任务,但是我希望它们的目的地保持不变。

例如,我有五个不同的键和四个缩减任务。
作业1的分配是:

  • partition_1-> NODE_1
  • partition_2-> NODE_1
  • partition_3-> NODE_2
  • partition_4-> NODE_3

  • 作业2的分配是:
  • partition_1-> NODE_2
  • partition_2-> NODE_3
  • partition_3-> NODE_1
  • partition_4-> NODE_3
  • 最佳答案

    在hadoop中,我们没有异径管的局部性,因此 yarn 会根据资源选择异径管的节点。无法强制hadoop在两个作业的同一节点上运行每个reducer。

    关于hadoop - AM如何为每个约简任务选择节点?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/52282730/

    24 4 0
    Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
    广告合作:1813099741@qq.com 6ren.com