gpt4 book ai didi

hadoop - 生成适当数量的 reducer 输出

转载 作者:可可西里 更新时间:2023-11-01 15:39:51 26 4
gpt4 key购买 nike

我正在运行一个简单的 map and reduce Hadoop 作业。 mapred.reduce.tasks 属性已由 Hadoop 管理员在 mapred-site.xml 文件中设置。假设它是 25。现在,我的工作只产生 4 个不同的 key ,所以 25 个 part-r-xxxx 文件中只有 4 个是非空的,其余的是空文件。我该如何防止这种情况?我只想要与生成的 key 数量一样多的输出文件(我事先不知道)。

谢谢。

最佳答案

我建议使用 LazyOutputFormat:

LazyOutputFormat.setOutputFormatClass(job, TextOutputFormat.class);

这将确保只有在该 reducer 有一些实际数据时才会创建输出文件。

关于hadoop - 生成适当数量的 reducer 输出,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/17977201/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com