gpt4 book ai didi

hadoop - 如何在级联中强制 reducer ?

转载 作者:可可西里 更新时间:2023-11-01 15:40:30 26 4
gpt4 key购买 nike

获得一些只有 reducer 而不是 mapper 才有的好处。

最佳答案

在 Google 网上论坛中找到我的答案:

使用 GroupBy,在执行分组时,它总是会使用 reducer:

previousPipe = new GroupBy(previousPipe); //this does a Group on Fields.All

减少文件数量(耦合度较低的另一种选择)

previousPipe = new GroupBy(previousPipe, new Fields("rand"), 
new RandonNumGen(Fields.Args));

其中 new RandonNumGen(Fields.Args) 是您从 Function 构建的函数,用于创建一个新的 Fields("rand"),它创建临时随机数(临时意味着您稍后删除该字段)。

有关更多信息,请查看此 Google Groups主题:

关于hadoop - 如何在级联中强制 reducer ?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/15952448/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com