hadoop - 并发执行 “single-threaded” hadoop:瓶颈在哪里？-6ren

hadoop - 并发执行 “single-threaded” hadoop:瓶颈在哪里？

转载作者：行者123 更新时间：2023-12-02 20:56:06

24

4

我正在运行一个计算密集型，基于hadoop的map-reduce应用程序。我已将hadoop配置为使用尽可能少的线程，但是多个并发部署会导致应用程序的执行时间增加。

我找不到执行时间增加的原因，因此必须存在一个我尚未发现的瓶颈和/或一个我错过的配置参数。

试验台

我的测试平台包括3个Dell PowerEdge R630，每个都带有Intel Xeon E5-2630v3:8核，每核2个线程。这些机器位于同一10 Gbps集群中，并通过同一交换机互连。这些将称为M1，M2和M3。

Hadoop配置

我正在hadoop-1.2.1上运行 java-1.6.0-openjdk-amd64 。我已将hadoop配置为使用尽可能少的线程。这是我的mapred-site.xml配置:

<configuration>
        <property>
                <name>mapred.map.tasks</name>
                <value>1</value>
        </property>
        <property>
                <name>mapred.tasktracker.map.tasks.maximum</name>
                <value>1</value>
        </property>
        <property>
                <name>mapred.reduce.tasks</name>
                <value>1</value>
        </property>
        <property>
                <name>mapred.tasktracker.reduce.tasks.maximum</name>
                <value>1</value>
        </property>
        <property>
                <name>mapred.job.tracker</name>
                <value>10.0.0.1:9001</value>
        </property>
        <property>
                <name>mapred.map.tasks.speculative.execution</name>
                <value>false</value>
        </property>
        <property>
                <name>mapred.reduce.tasks.speculative.execution</name>
                <value>false</value>
        </property>
        <property>
                <name>tasktracker.http.threads</name>
                <value>2</value>
        </property>
        <property>
                <name>mapred.reduce.parallel.copies</name>
                <value>2</value>
        </property>
</configuration>

部署方式

实际部署发生在通过 nova-docker生成的容器上。在每个部署中，我生成3个容器 C1， C2和 C3，每台物理机有1个容器。假设 C1产生了 M1， C2产生了 M2， C3产生了 M3。

尤其是:

一个容器C1充当“主”；它运行Namenode和Jobtracker服务。

其他两个容器C2和C3充当“奴隶”，它们运行Datanode和Tasktracker服务。

我已经进行了两次实验:

一个并发部署

两个并发部署

“两个并发”部署意味着有两个相同的部署并发运行。为了进一步说明，当运行两个部署时，存在六个容器:
- C1a上的 C1b和 M1 - C2a上的 C2b和 M2 - C3a上的 C3b和 M3 C1a， C2a和 C3a属于相同的map-reduce执行，并且按预期相互通信。分别针对容器 C1b， C2b和 C3b也是一样。

执行时间处理时间

两种情况(1个并发部署，2个并发部署)都运行了10次，以获取良好的样本。这是1个和2个并发部署的执行时间。显而易见，在2个并发部署中，执行时间增加了6.72％。

问题

我的问题是:为什么即使我将hadoop配置为使用尽可能少的线程，运行两个并发部署时执行时间也会更长？尤其是:

我可以遇到PCIe瓶颈或CPU瓶颈吗？ (请参见下文)

在配置hadoop以使用尽可能少的线程时，我是否错过了其他事项？

hadoop是否使用了比我所知道的更多的线程，这可能会使CPU或其他资源拥挤？

我已经调查了以下内容:

带宽消耗:我们绝对不是网络瓶颈。网络可以维持高达10 Gbps的速度，该应用程序的平均消耗不超过400-500 Mbps，并且没有其他人使用该群集。

PCIe:我已经测量了PCIe带宽，以调查是否存在瓶颈。我打开了一个related question on Superuser询问我的读数是否表明PCI拥塞。

CPU使用率:请参阅下一节。

CPU指标

我安装了 PCM tools来测量执行期间的CPU使用率。这些工具安装在承载从属容器(Datanode，Tasktracker)的 物理机之一上。

在以下情况下，我测量了处于 Activity 状态的内核的利用率:

空闲(标记为“0个租户”)

1个并发部署(标记为“1个租户”)

2个并发部署(标记为“2个租户”)

显而易见，1个或2个并发部署的CPU利用率是相似的，尽管1个部署的CPU利用率平均较高。因此，CPU利用率似乎不是问题。我可能会缺少什么？

请在评论中让我知道我是否可以提供任何其他信息。

最佳答案

为了回答我自己的问题，最终的瓶颈是写入磁盘时的I / O带宽。在iotop的帮助下，我测量了写入速度:

并使用dd测量了最大写入速度:

# dd if=/dev/zero of=diskbench bs=1G count=1 conv=fdatasync
1+0 records in
1+0 records out
1073741824 bytes (1.1 GB) copied, 7.38756 s, 145 MB/s

写入速度似乎恒定在10 MB /秒左右，经常达到120-160 MB /秒。一个自然的问题是“为什么我们要连续写入磁盘？” hadoop的工作方式是:映射器将中间输出写入本地磁盘，而不是HDFS，正如 here所述。

因此，由于映射器不断向本地硬盘写入数据，因此即使我们有足够的CPU处理能力，在运行多个hadoop时，也会出现瓶颈。

关于hadoop - 并发执行 “single-threaded” hadoop:瓶颈在哪里？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/44489647/

24

4

0

文章推荐： linux - shell形式的docker入口点可以使用运行时命令args吗？

文章推荐： node.js - 容器中的 Node 红色插件 : Node missing

并发
我正在尝试在多线程环境中实现某种累积逻辑；我想知道没有 lock 和 synchronized 关键字是否有更好/更快的方法来做到这一点？以下是我当前的代码: public class Concurr
并发 - 实现信号量的监视器
我需要帮助构建一个实现信号量的监视器，简单的 C 示例就可以。这是为了证明可以在任何可以使用信号量的地方使用监视器。最佳答案如果您说允许使用互斥锁/condvars，请检查: #include
JQuery .each() 并发
我已经构建了一些返回部分产品目录的 ajax，并且我正在尝试将 xml 输出到文档中，到目前为止，这是我所拥有的: $("#catalog").append("Item NamePriceDe
mysql 并发
很抱歉，如果我的问题之前已经被问过，或者它太明显了，但我真的需要澄清这一点。感谢您的帮助。在多用户界面中，如果来自不同用户的相同事务同时到达服务器，会发生什么？我有下一张表: create tab
Java程序输出——并发
这可能是一个愚蠢的问题，但是这个程序的输出(它的方式)可以为零吗？ public class Test2{ int a = 0; AtomicInteger b = new Atomi
Http请求/并发？
假设我本地主机上的一个网站处理每个请求大约需要 3 秒。这很好，正如预期的那样(因为它在幕后进行了一些奇特的网络)。但是，如果我在选项卡(在 firefox 中)中打开相同的 url，然后同时重新加
MongoDB 并发
我对 MongoDB 的读锁定有点困惑。单个集合可以支持多少个并发读取操作？最佳答案如 tk 给出的链接中所写:http://www.mongodb.org/pages/viewpage.acti
并发，4个CUDA应用竞争获取GPU资源
如果有四个并发的 CUDA 应用程序在一个 GPU 中竞争资源会发生什么这样他们就可以将工作卸载到图形卡上了？ Cuda Programming Guide 3.1 提到那里某些方法是异步的: 内核
spark学习之并行度、并发、core数和分区的关系
👊上次的百度面试遇到了关于spark的并发数的问题，今天我们就来将这些问题都一并解决一下，图画的的有点丑，还行大家见谅，百度实习的问题我放在了下面的链接👇：链接: 2022百度大数据开发工程师实
multithreading - Groovy 并发
我对 Groovy 线程有疑问。我的任务是以某种方式翻译给定目录中的每个文件并将生成的输出放在其他目录中的文件中。我编写了以下代码，该代码有效: static def translateDir(
java - 并发:同步与锁定
Java中的同步和锁定有什么区别？最佳答案 synchronized是语言关键字；锁是对象。当一个方法或代码块被标记为同步时，您是说该方法或代码块必须先获得某个锁对象(可以在同步的语法中指定)才能
并发 RPC 服务器
我需要创建一个能够同时处理来自客户端的多个请求的并发 RPC 服务器。使用 rpcgen linux编译器(基于sun RPC)，不支持-A为并发服务器创建 stub 的选项。 (-A 选项在 so
Java 并发 - 这有效吗？
System.out.println("Enter the number of what you would like to do"); System.out.println("1 = Manuall
ipad - 并发 UIAlertControllers
我正在将我的应用程序移植到 iOS 8.0 并注意到 UIAlertView 已被弃用。所以我改变了使用 UIAlertController 的方法。这在大多数情况下都有效。除了，当我的应用程序打
java - 并发 - 条件同步方法
我正在逐行同时读取两个文本文件。我特别想做的是当lineCount在每个线程上都是相同的我想看看扫描仪当前正在读取的字符串。我环顾四周寻找可以实现的某些模式，例如 Compare and Swap
Java 并发 - 中断策略
我正在阅读 Java Concurrency in Practice .在章节中断政策部分取消和关闭它提到 A task should not assume anything about the
c++ - 有没有比下面更好的方法来使用C++并发？
我正在尝试学习线程，互斥等的基础知识。遵循here的文档和示例。在下面的代码中，我得到预期的输出。问题: 想确认我是否有任何陷阱？我们如何改善下面的代码？我的线程在哪一行尝试获取互斥锁或正在等待互斥
multithreading - 并发、并行和异步方法有什么区别？
并发是指两个任务在不同的线程上并行运行。但是，异步方法并行运行，但在同一个线程上。这是如何实现的？另外，并行性怎么样？这三个概念有什么区别？最佳答案并发和并行实际上与您正确推测的原理相同，两者都
java - 并发:使用非同步方法更改变量
以此ConcurrentDouble类定义为例: public class ConcurrentDouble { public double num = 0; public void subt
java - 并发/多线程何时有助于提高性能？
在得知并发确实增加了许多人的吞吐量后，我一直计划在项目中使用并发。现在我在多线程或并发方面还没有做太多工作，因此决定在实际项目中使用它之前学习并进行简单的概念验证。以下是我尝试过的两个示例: 1.

首页

博学

6Ren·AI

商城

hadoop - 并发执行 “single-threaded” hadoop:瓶颈在哪里？