gpt4 book ai didi

hadoop - 如何找到一个特定的键值对作为 reducer 的输出

转载 作者:可可西里 更新时间:2023-11-01 16:29:25 26 4
gpt4 key购买 nike

我需要使用 MR 找到得分最高的学生

Paul 90
Ben 20
Cook 80
Joe 85

所以reducer的输出应该是(Paul 90)

谁能帮我解决这个问题?

最佳答案

执行此操作的一个好方法是在 Hadoop 中进行二次排序。您的 map 输出键应该是(名称、标记)的组合。

然后您将实现一个自定义比较器,它可以采用此键并基于标记仅比较 2 个给定值并根据较高标记进行排序。

通常我们会实现一个分组比较器,但在这种情况下,我们希望所有的键都进入一个单一的缩减器。因此,我们将忽略分组比较器中的关键差异。

在 reducer 中只获取第一个值并退出。

二次排序详情:Secondary Sort

关于hadoop - 如何找到一个特定的键值对作为 reducer 的输出,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/42092170/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com