gpt4 book ai didi

hadoop - 映射器可以知道正在运行多少个映射器吗?

转载 作者:行者123 更新时间:2023-12-02 20:13:27 24 4
gpt4 key购买 nike

在hadoop Map-Reduce框架中,当应用程序正在运行时,可以知道程序中正在运行的工作程序数量。工作程序的数量与文件拆分的数量相同,换句话说,是否可以动态知道文件拆分的数量?

最佳答案

可以通过mapred.map.tasksmared.reduce.tasks配置属性(一旦提交了作业)来查询构成该作业的 map task 和化简任务的总数。

如果您查看源代码,可以看到它已在org.apache.hadoop.mapred.JobClient:784中设置(是的,分割数相同)

// Create the splits for the job
LOG.debug("Creating splits at " + fs.makeQualified(submitSplitFile));
int maps;
if (job.getUseNewMapper()) {
maps = writeNewSplits(context, submitSplitFile);
} else {
maps = writeOldSplits(job, submitSplitFile);
}
job.set("mapred.job.split.file", submitSplitFile.toString());
job.setNumMapTasks(maps); // here is where mapred.map.tasks is set

关于hadoop - 映射器可以知道正在运行多少个映射器吗?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/10345351/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com