gpt4 book ai didi

hadoop - 是否可以在 hadoop 中禁用排序?

转载 作者:可可西里 更新时间:2023-11-01 14:17:31 24 4
gpt4 key购买 nike

我的工作不需要排序,只需要每个键的聚合信息。所以我认为是否可以禁用所有信息的排序以提高性能。


注意:我无法将 reducer 计数设置为零,因为我需要在多个映射器之间聚合数据。我只是对一个 reducer 的排序结果不感兴趣。

最佳答案

对map输出进行排序的主要目的之一是,当元组到达reducer时,reducer必须使)调用reducer任务,使用排序后的map输出列表,它可以通过顺序扫描(当它看到不同的键然后只创建新列表),如果映射输出未排序则它必须扫描整个列表以形成具有相同键的列表。

关于hadoop - 是否可以在 hadoop 中禁用排序?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/9074910/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com