gpt4 book ai didi

hadoop - 如何按特定顺序对送往 reducer 的值进行排序

转载 作者:行者123 更新时间:2023-12-02 21:51:11 25 4
gpt4 key购买 nike

在我的map-reduce作业中,映射器的输出类型为<Text, FileAlias>,类FileAlias具有两个属性,如下所示

   public class FileAlias extends Configured implements WritableComparable<FileAlias>{

public boolean isAlias;
public String value;
...
}

对于每个输出键( Text类型),只有一个输出值( FileAlias类型)将 isAlias属性设置为true。我希望此输出值成为送入reducer的 OutputCollector中的第一项。有什么办法吗?

最佳答案

看一看Job对象上的setGroupingComparatorClass方法。您应该能够实现一个比较器,该比较器在传递给reduce任务的Iterable中首先使FileAliasisAlias == true一起使用。

关于hadoop - 如何按特定顺序对送往 reducer 的值进行排序,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/20766209/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com