gpt4 book ai didi

java - reducer功能一键多输出,Hadoop

转载 作者:可可西里 更新时间:2023-11-01 16:15:05 24 4
gpt4 key购买 nike

我需要做的是为一个键输出两个值作为我的 reduce 函数的输出,但我遇到了一些麻烦。 reduce 函数以 Id 和与该 Id 关联的整数列表的形式接收数据。它需要输出该 Id、列表中整数的平均值和列表的长度。

然而,reduce函数的实现应该有OutputCollector <Text, IntWritable>作为参数,明确将与每个键关联的输出数量限制为 1。

在这方面的任何帮助将不胜感激。提前致谢。

Hadoop 版本:2.0.0

最佳答案

您必须使用 MultipleOutputs。在工作中:

MultipleOutputs.addMultiNamedOutput(job,
"Name",
SequenceFileOutputFormat.class, Text.class,
Writable.class);

在 reducer 中:

multipleOutputs.getCollector

关于java - reducer功能一键多输出,Hadoop,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/23185598/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com