gpt4 book ai didi

hadoop - Hadoop MR 应用程序中 Reducer 的动态数量

转载 作者:可可西里 更新时间:2023-11-01 15:18:39 25 4
gpt4 key购买 nike

提交作业后,有什么方法可以设置 reduce task 的数量吗?比如我需要根据start alphabet收集英文单词,我可以直接设置reduce tasks的数量为26。但是万一出现无法预先确定所需reducer数量的情况,有没有什么办法可以完成要求?这里的要求与集群上的节点数量无关,它只取决于正在处理的键。举例来说,每次遇到新键时,reducer 的数量都会增加一个。在此先感谢您的支持。

最佳答案

Is there any means to set the number of reduce tasks once a job is submitted?

没有

For example if I need to collect English words based on start alphabet, I can directly set the number of reduce tasks as 26.

即使在上述场景中,您也不需要 26 个 reducer,而只需 1 个 reducer。 Hadoop 框架为每个键一次又一次地调用 reduce 函数。 MultipleOutputFormat可用于根据键/值对(第一个字母表)将单词写入不同的文件。

作业的 reducer 数量标准应该是它正在处理的数据量。另外,请记住,花费最多时间的 reducer 将决定完成作业的时间。

关于hadoop - Hadoop MR 应用程序中 Reducer 的动态数量,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/11225477/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com