gpt4 book ai didi

hadoop - 在字数统计程序中使用 2 个 reducer 的输出

转载 作者:可可西里 更新时间:2023-11-01 16:37:35 24 4
gpt4 key购买 nike

假设具有键“the”、“sound”、“is”的键值对由 reducer 1 处理,而具有键“it”、“right”、“sounds”的键值对是由 reducer 2 处理。

两个 reducer 的输出是什么?

每个reducer的输出文件会先排序然后合并再排序吗?

当 reducer 收到它们时,它是否已经按字母顺序排序,以便 reducer 1 收到“is”、“it”、“right”,reducer 2 收到“the”、“sound”、“sounds”?

最佳答案

回答您的问题:

  1. reducer 的输出将是其出现的单词和计数。
  2. 在不同键上工作的 reducer 的输出永远不会合并。 mapreduce 中没有这样的阶段。
  3. mapper 的输出被排序并送入 reducer;但是不同的 reducer 随机发出其输出,并且所有 reducer 的输出都不会再次排序。 mapreduce 中没有这样的阶段。

即使 reducer 正在按排序顺序获取键,但请认为每个 reducer 都运行在一个单独的 JVM 和一个单独的进程中。他们在“不知道”有更多 reducer 正在运行的情况下输出数据。

关于hadoop - 在字数统计程序中使用 2 个 reducer 的输出,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/48819246/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com