hadoop - 生成适当数量的 reducer 输出-6ren

hadoop - 生成适当数量的 reducer 输出

转载作者：可可西里更新时间：2023-11-01 15:39:51

我正在运行一个简单的 map and reduce Hadoop 作业。 mapred.reduce.tasks 属性已由 Hadoop 管理员在 mapred-site.xml 文件中设置。假设它是 25。现在，我的工作只产生 4 个不同的 key ，所以 25 个 part-r-xxxx 文件中只有 4 个是非空的，其余的是空文件。我该如何防止这种情况？我只想要与生成的 key 数量一样多的输出文件(我事先不知道)。

谢谢。

最佳答案

我建议使用 LazyOutputFormat:

LazyOutputFormat.setOutputFormatClass(job, TextOutputFormat.class);

这将确保只有在该 reducer 有一些实际数据时才会创建输出文件。

关于hadoop - 生成适当数量的 reducer 输出，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/17977201/

文章推荐： apache - 尝试在 win 7 上安装和配置 Hadoop 时出错

文章推荐： c++ - 将静态 libcurl 添加到 Code::Blocks IDE

文章推荐： hadoop - CDH伪集群启动Jobtracker和Tasktracker失败

此代码的 Java 适当 I/O 为空终止字符
这段代码在 Java 中的等价物是什么？我放了一部分，我对 I/O 部分感兴趣: int fd = open(FILE_NAME, O_WRONLY); int ret = 0; if (fd =
python - 在 python 中将张量 T[a1,a2,a3] 适当 reshape 为矩阵 M[a2,a1*a3]
我正在尝试将维度为 d1,d2,d3 的张量 M[a1,a2,a3] reshape 为维度为 d2, d1*d3 的矩阵 M[a2,a1*a3]。我试过 M.reshape(d2,d1*d3) 但是

可可西里

个人简介

我是一名优秀的程序员,十分优秀！

作者热门文章

滴滴打车优惠券免费领取

全站热门文章

首页

博学

6Ren·AI

商城

hadoop - 生成适当数量的 reducer 输出