gpt4 book ai didi

machine-learning - Mahout FPG 算法始终使用单个 reducer

转载 作者:行者123 更新时间:2023-11-30 08:50:25 25 4
gpt4 key购买 nike

我正在使用Mahout (v 0.7) parallel FPG algorithm ,CLI模式,生成频繁模式。该算法运行良好并正确生成频繁模式。

我遇到的问题是该算法在生成模式的第二阶段始终使用一个 reducer 。该算法为每个输入分割创建一个映射器,但在第二阶段,所有映射器将其输出发送到一个 reducer ,这显着减慢了算法速度。

我什至尝试设置-Dmapred.reduce.tasks参数来覆盖默认的reducers数量,但它不起作用。

如果可能的话,我想将第二阶段的工作分成多个reducer。

我使用的 Mahout 的 FPG 命令:

 mahout fpg \
-i /path/to/input \
-o /path/to/output \
-s 5 \
-k 100 \
-method mapreduce

最佳答案

您可以通过在命令末尾添加以下内容来更改映射器和化简器的数量:

 -Dmapred.map.tasks=1000 -Dmapred.reduce.tasks=1000

对我来说,我无法使用此参数更改映射器的数量,但我始终能够控制 reducer 的数量。

关于machine-learning - Mahout FPG 算法始终使用单个 reducer ,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/18708497/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com