gpt4 book ai didi

hadoop - Hive作业在减少阶段永远运行

转载 作者:行者123 更新时间:2023-12-02 21:16:58 25 4
gpt4 key购买 nike

我在60 GB dataset in Hive上运行查询。当我触发查询时,270 mappers将在15分钟内完成,但是到reducer state to complete 0.01%时,它至少需要45分钟才能达到1小时。因此,这项工作将永远进行下去。有什么办法可以解决

最佳答案

为什么不使用组合器和分区器?

  • 案例
    您可以使用合并器,这是一个小型还原阶段。
    例如:如果您的映射器生成100行数据,并且如果您使用合并器对其进行聚合,则它将减少为一行和1行* 270(mappers)= 270行,并将其作为输入。
  • 案例:
    您可以使用分区程序根据键(如果唯一)或值(在范围内)对数据进行分区,例如value> 20返回0;否则返回1。这样,我们将拥有更多的化简器来处理数据。
  • 关于hadoop - Hive作业在减少阶段永远运行,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/38541888/

    25 4 0
    Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
    广告合作:1813099741@qq.com 6ren.com