作者热门文章
- android - RelativeLayout 背景可绘制重叠内容
- android - 如何链接 cpufeatures lib 以获取 native android 库?
- java - OnItemClickListener 不起作用,但 OnLongItemClickListener 在自定义 ListView 中起作用
- java - Android 文件转字符串
我正在运行一个简单的 map and reduce Hadoop
作业。 mapred.reduce.tasks
属性已由 Hadoop
管理员在 mapred-site.xml
文件中设置。假设它是 25。现在,我的工作只产生 4 个不同的 key ,所以 25 个 part-r-xxxx
文件中只有 4 个是非空的,其余的是空文件。我该如何防止这种情况?我只想要与生成的 key 数量一样多的输出文件(我事先不知道)。
谢谢。
最佳答案
我建议使用 LazyOutputFormat
:
LazyOutputFormat.setOutputFormatClass(job, TextOutputFormat.class);
这将确保只有在该 reducer 有一些实际数据时才会创建输出文件。
关于hadoop - 生成适当数量的 reducer 输出,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/17977201/
这段代码在 Java 中的等价物是什么?我放了一部分,我对 I/O 部分感兴趣: int fd = open(FILE_NAME, O_WRONLY); int ret = 0; if (fd =
我正在尝试将维度为 d1,d2,d3 的张量 M[a1,a2,a3] reshape 为维度为 d2, d1*d3 的矩阵 M[a2,a1*a3]。我试过 M.reshape(d2,d1*d3) 但是
我是一名优秀的程序员,十分优秀!