gpt4 book ai didi

java - hadoop中,reduce任务如何从map任务中拉取数据

转载 作者:行者123 更新时间:2023-12-01 15:25:30 31 4
gpt4 key购买 nike

我了解reducer通过http拉取map输出。但是,由于每个 Map 任务都会将其所有溢出合并到一个文件中,因此 Reduce 任务如何从 Map 任务中提取这些中间数据呢?只是该文件的一部分?

最佳答案

map任务的输出按分区号排序。每个分区号对应一个reducer。当reducer拉取输出时,文件指针将偏移到reducer的分区号的起始位置并开始读取。当然,在映射器端维护一些分区号到文件偏移表来实现这一点。

关于java - hadoop中,reduce任务如何从map任务中拉取数据,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/10217484/

31 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com