- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我正在尝试分析默认的map reduce作业,该作业没有定义mapper或reducer。
即使用IdentityMapper和IdentityReducer的一种
为了使自己清楚,我只是写了我的身份简化程序
public static class MyIdentityReducer extends MapReduceBase implements Reducer<Text,Text,Text,Text> {
@Override
public void reduce(Text key, Iterator<Text> values,
OutputCollector<Text, Text> output, Reporter reporter)
throws IOException {
while(values.hasNext()) {
Text value = values.next();
output.collect(key, value);
}
}
}
$ hadoop fs -cat NameAddress.txt
Dravid Banglore
Sachin Mumbai
Dhoni Ranchi
Dravid Jaipur
Dhoni Chennai
Sehwag Delhi
Gambhir Delhi
Gambhir Calcutta
I was expecting
Dravid Jaipur
Dhoni Chennai
Gambhir Calcutta
Sachin Mumbai
Sehwag Delhi
I got
$ hadoop fs -cat NameAddress/part-00000
Dhoni Ranchi
Dhoni Chennai
Dravid Banglore
Dravid Jaipur
Gambhir Delhi
Gambhir Calcutta
Sachin Mumbai
Sehwag Delhi
最佳答案
键对于化简器是唯一的,并且对化简器的每个调用都具有唯一的键值,并且该键值可迭代与该键关联的所有值。您正在做的是遍历传入的所有值并写出每个值。
因此,在您的情况下, call 数量可能少于数据数量。您仍然最终将所有值都写了出来。
关于hadoop - outputcollector如何工作?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/12763478/
在计算输出的数字平均值后,我无法返回 flaot 值。收集..任何人都可以帮助我吗?? 公共(public)静态类 MapClass 扩展了 MapReduceBase 实现映射器{ private
这是引用 Storm's OutputCollector尤其是它的 ack(Tuple) 和 fail(Tuple) 方法。 这两种方法都只是将调用转移到 IOutputCollector 类型的 _
我想知道 OutputCollector 的“实例”输出是否用于映射函数:output.collect(键,值)这个 -output- 将键值对存储在某处?即使它发送到 reducer 函数,它们也一
使用BaseRichBolt时,有什么区别 _collector.fail(tuple) 和 _collector.ack(tuple) 它是否像超时一样导致元组被重新发送?或者它只是丢弃元组。 If
在 this文章我找到了这个用于字数统计的映射器代码: public static class MapClass extends MapReduceBase implements Mapp
我刚刚开始学习 Hadoop,并且仍在尝试和尝试理解事物,我真的很好奇 OutputCollector 类 collect() 方法的用法,从现在开始我找到的所有示例都只调用此方法一次。如果这种方法的
我是一名优秀的程序员,十分优秀!