gpt4 book ai didi

hadoop - 如何知道 mapreduce 程序中映射器的输入拆分数?

转载 作者:可可西里 更新时间:2023-11-01 16:31:45 26 4
gpt4 key购买 nike

mapreduce 程序中将它们添加到输出收集器之前,有什么方法可以知道输入拆分的数量

我试过下面的代码

opCol.collect(new Text(Integer.toString(total)), new IntWritable(
Count))

任何帮助将不胜感激。谢谢。

最佳答案

如果您检查 FileInputFormat类的 getSplits 方法,它将拆分的数量设置为 job.getConfiguration().setLong(NUM_INPUT_FILES, files.size());

因此从您的映射器使用 int splitCount = context.getConfiguration().get("mapreduce.input.fileinputformat.numinputfiles");

关于hadoop - 如何知道 mapreduce 程序中映射器的输入拆分数?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/28518696/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com