gpt4 book ai didi

hadoop - hadoop reduce任务如何处理 map 分组数据

转载 作者:行者123 更新时间:2023-12-02 21:24:03 25 4
gpt4 key购买 nike

Reduce方法处理 map 中的分组数据。但是我想知道 reduce task 如何获取组数据?如果 map 输出许多分组数据,那么每个reduce任务是否只读取相同数量的组?机制是什么?

最佳答案

如何 reduce task 获取组数据?

在随机和排序阶段处理

在此阶段,由映射器发送的datad按键分组(类似于group by(key)),最后获得key,List <>结果。结果发送到 reducer 。如果需要将结果发送到不同的reducer,则应注意分区阶段,该阶段与Shuffle和Sort阶段是不同的阶段。

此阶段由Hadoop框架完成,据我所知,您对此阶段没有任何事要做或更改。

enter image description here

我也建议看看这个问题What is the purpose of shuffling and sorting phase in the reducer in Map Reduce Programming?

关于hadoop - hadoop reduce任务如何处理 map 分组数据,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/36625404/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com