- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我必须获取 Mapper 的输出并将其传递给我的 Reducer 4 次。
Reducer 是数据之间的合并。所以在 Mapper 之后,Reducer 在第一次迭代时合并一些数据,更改键和重新合并以及第二次迭代,等等......
我尝试使用 job.setNumReduceTasks(4)
但什么也没发生。我只有 1 个输出和一个简单的 System.out.println()
放置在我的 Reducer 中仅显示 1 条消息。
Job job = new Job(getConf());
job.setJarByClass(Driver.class);
job.setJobName(this.getClass().getName());
FileInputFormat.setInputPaths(job, new Path(input));
FileOutputFormat.setOutputPath(job, new Path(output+System.nanoTime()));
job.setMapperClass(KMMapper.class);
job.setReducerClass(KMReducer.class);
job.setNumReduceTasks(4);
job.setMapOutputKeyClass(Text.class);
job.setMapOutputValueClass(Text.class);
job.setOutputKeyClass(Text.class);
job.setOutputValueClass(Text.class);
job.waitForCompletion(true);
Also, please update your question with possible i/p adn o/p
最佳答案
I have to take the output of my Mapper and pass it 4 times to my Reducer.
ChainMapper
或
ChainReducer
.
job.setNumReduceTasks(4);
仅有助于并行运行 4-reducer 任务,基于默认的 key-partition 机制共享映射器输出(称为中间数据)。
关于java - MapReduce 多个归约任务,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/42224273/
我有一个需要映射/缩减的文件,其中输出需要总和和日期的最大值。我有总和部分的工作,但是,我不确定如何将最大日期作为减少的输出的一部分。 输入数据如下所示: ID1, ID2, date,
我必须为 C 的一个子集构建一个编译器。显然,因为这是我第一次做这样的事情,所以进展得不是很好。然而。我目前正在尝试为所述子集构建词法分析器和解析器。 我决定逐步构建它,并在出现错误时进行修复。所以我
我听说过很多关于 Map/Reduce 的内容,尤其是在 Google 大规模并行计算系统的背景下。到底是什么? 最佳答案 来自 Google 的摘要 MapReduce研究发表页面: MapRedu
我正在使用 JavaScript 原生 reduce,但是我想稍微改变分组以获得我想要的结果。我有一个数组如下: const people = [ {name: "John", age: 23,
我试图让一个简单的 map reduce 在 MongoVUE 中工作,但它没有返回任何结果,我只是想让它输出每个 userID 的计数,这样我就可以有一个工作示例来构建。 function Map(
我可能错了,但我见过的所有(?)Apache Hadoop 示例都将存储在本地文件系统上的文件作为输入(例如 org.apache.hadoop.examples.Grep) 有没有办法在 Hadoo
如何在 Swift 4 中以更优雅的方式完成类似以下的事情,例如使用 map 和/或 reduce。 为了在此处发布,我简化了代码,但请注意它确实需要使用索引。 var numbers = [50,
我是一名优秀的程序员,十分优秀!