gpt4 book ai didi

Hadoop streaming api - 限制每个作业的映射器数量

转载 作者:可可西里 更新时间:2023-11-01 14:46:00 26 4
gpt4 key购买 nike

我有一个在小型 hadoop 集群上运行的作业,我想限制它为每个数据节点生成的映射器的数量。当我使用 -Dmapred.map.tasks=12 时,出于某种原因它仍然生成 17 个映射器。我已经想出了一种在全局范围内限制它的方法,但我想在每个工作的基础上进行。

最佳答案

在 Map Reduce 中,生成的映射器总数取决于根据您的数据创建的输入拆分。

每个输入拆分都会生成一个映射器任务。所以,您不能减少 Map Reduce 中映射器的数量。

关于Hadoop streaming api - 限制每个作业的映射器数量,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/15914356/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com