gpt4 book ai didi

hadoop - Hadoop Scheduler保留数据局部性

转载 作者:行者123 更新时间:2023-12-02 20:11:46 25 4
gpt4 key购买 nike

我检查了几份文档,但对Hadoop保留数据局部性中的任务调度有疑问。
假设现在任务t的输入数据为D1,复制因子为3(这意味着我在3个不同的服务器上存储了D1的3个副本),现在t到达时,将在哪个严格的t上分配? (考虑默认调度程序)。

最佳答案

Hadoop将尝试使用所有可用的映射器插槽。如果它有一种分配任务保存数据局部性的方法,则它将这样做(也就是说,如果包含D1副本的那三台服务器之一具有可用的映射器插槽,它将尝试将其放置在该服务器上)。如果这3个服务器上的所有映射器都被占用,但是另一台服务器具有可用的映射器插槽,则任务将放置在该映射器上。

关于hadoop - Hadoop Scheduler保留数据局部性,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/14226407/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com