gpt4 book ai didi

hadoop - mapreduce:可以减少阶段 "emit"吗?

转载 作者:行者123 更新时间:2023-12-02 20:13:32 25 4
gpt4 key购买 nike

假设我们正在节点上进行处理。等待处理的键是 2,1,3。
在预处理中,键将被排序为 1,2,3。
处理顺序为:

开始处理 1
处理 1 完成
开始处理 2
处理2完成
开始处理 3
处理3完成

在处理 key 1 时,我可以用 key 2 发出一些东西吗?在处理 key 2 时,将处理发出的东西。

我认为这与并行处理的概念没有冲突,因为同一节点上的键将按顺序处理。

最佳答案

不,因为分区步骤已经发生,所以您的 reduce 步骤的任何输出都将转到目标文件夹,而不是返回输入文件夹

分区输入 => reducer => 输出

您始终可以使用身份映射器和相同的 reducer 运行第二个 mapreduce 作业。

关于hadoop - mapreduce:可以减少阶段 "emit"吗?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/10273573/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com