gpt4 book ai didi

hadoop - Hadoop中的mapred进程是多线程的吗?

转载 作者:可可西里 更新时间:2023-11-01 15:17:41 26 4
gpt4 key购买 nike

我已经将 hadoop 集群的 mapred_map_tasks_max 配置为 6,正如预期的那样,我看到在启动 PIG 作业时有 6 个 mapred 进程在运行。

然而,我有点惊讶地看到其中一些进程的 CPU 使用率超过 100%,有时甚至达到 1000%+。 mapreduce 是否默认为多线程?这会不会是 Pig 本身的问题?

我在网上只能找到一些关于设置 (mapred.map.runner.class) 的信息,但这似乎并没有设置为多线程。

谢谢。

PID USER PR NI VIRT RES SHR S %CPU %MEM TIME+ 命令
2630 mapred 20 0 53.4g 2.8g 12m S 218.1 4.5 1:17.32 java
2553 mapred 20 0 53.4g 2.8g 12m S 110.7 4.5 1:25.07 java
2636 mapred 20 0 53.4g 2.8g 12m S 110.4 4.5 1:11.58 java
2437 mapred 20 0 53.5g 5.6g 12m S 108.1 8.8 3:46.52 java
2353 mapred 20 0 53.5g 5.2g 12m S 101.1 8.3 3:35.27 java
2239 mapred 20 0 53.5g 5.8g 12m S 82.6 9.3 3:54.47 java

最佳答案

Hadoop 可以使用多线程映射器(参见 http://kickstarthadoop.blogspot.com/2012/02/enable-multiple-threads-in-mapper-aka.html)。据我所知,pig 不支持多线程作业(尽管您可以多线程调用 Pig 服务器... https://issues.apache.org/jira/browse/PIG-240)。

也就是说,Pig 默认情况下会在同一主机上运行多个映射器/缩减器,每个可用内核一个映射器/缩减器。

关于hadoop - Hadoop中的mapred进程是多线程的吗?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/16327557/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com