gpt4 book ai didi

hadoop - 为什么我的 map reduce 作业按顺序运行?

转载 作者:可可西里 更新时间:2023-11-01 14:53:46 24 4
gpt4 key购买 nike

我有一个 4 节点集群和总共 96GB 内存。

我已将我的输入分成 100 个文件,并将作业设置为有 100 个映射器。从日志来看,映射器似乎是按顺序运行的。

[2014/10/08 15:22:36] INFO: Total input paths to process : 100
[2014/10/08 15:22:36] INFO: number of splits:100
[2014/10/08 15:22:36] INFO: Starting task: attempt_local1244628585_0001_m_000000_0
[2014/10/08 15:22:36] INFO: Submitting tokens for job: job_local1244628585_0001
[2014/10/08 15:22:36] INFO: Processing split: hdfs://.../input/in10:0+2
[2014/10/08 15:22:38] INFO: Task:attempt_local1244628585_0001_m_000000_0 is done. And is in the process of committing
[2014/10/08 15:22:38] INFO: Task attempt_local1244628585_0001_m_000000_0 is allowed to commit now
[2014/10/08 15:22:38] INFO: Saved output of task 'attempt_local1244628585_0001_m_000000_0' to hdfs://.../output/_temporary/0/task_local1244628585_0001_m_000000
[2014/10/08 15:22:38] INFO: hdfs://.../input/in10:0+2
[2014/10/08 15:22:38] INFO: Task 'attempt_local1244628585_0001_m_000000_0' done.
[2014/10/08 15:22:38] INFO: Finishing task: attempt_local1244628585_0001_m_000000_0
[2014/10/08 15:22:38] INFO: Starting task: attempt_local1244628585_0001_m_000001_0

....

不断。基本上,它会在开始另一项任务之前完成一项任务。

最佳答案

您正在以本地模式运行:

[2014/10/08 15:22:36] INFO: Starting task: attempt_**local**1244628585_0001_m_000000_0

根据您的 Hadoop 版本,您需要配置 JobTracker 地址或 ResourceManager 地址。

关于hadoop - 为什么我的 map reduce 作业按顺序运行?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/26267476/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com