gpt4 book ai didi

hadoop - 请帮助Hadoop中的Shuffle和Sorting的必要性是什么?

转载 作者:可可西里 更新时间:2023-11-01 14:49:53 25 4
gpt4 key购买 nike

在一个普通的mapreduce wordcount程序中,我们是否需要设置shuffle和sort的方法,或者框架会处理这个?

最佳答案

框架会处理这个。 洗牌 是将数据从映射器传输到缩减器的过程,缩减器按中间键(词)的升序(字典顺序)缩减数据。

您可以更改默认设置,但没有必要在 wordcount 程序中这样做。您只需要设置一个映射器和一个缩减器以及可选的(但确实有助于提高速度)一个组合器。

甚至不需要自己实现映射器和缩减器,因为 hadoop 自带了这样的字数映射器(TokenCounterMapper)和缩减器(IntSumReducer,也可以用作组合器)的实现。

关于hadoop - 请帮助Hadoop中的Shuffle和Sorting的必要性是什么?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/25197468/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com