Hadoop distcp 作业成功但尝试_xxx 被 ApplicationMaster 杀死-6ren

Hadoop distcp 作业成功但尝试_xxx 被 ApplicationMaster 杀死

转载作者：行者123 更新时间：2023-12-02 21:07:10

24

4

运行 distcp 作业我遇到以下问题:
几乎所有 map task 都被标记为成功，但附注说 Container 已被杀死。

在在线界面上， map 作业的日志显示:
进度 100.00
状态成功

但在注意下它几乎每次尝试都说(〜200)
容器被 ApplicationMaster 杀死。
容器被 ApplicationMaster 杀死。容器应要求被杀死。退出代码是 143

在与尝试关联的日志文件中，我可以看到一条日志显示任务“尝试_xxxxxxxxx_0”已完成。

对于所有作业/尝试，stderr 输出为空。

在查看应用程序主日志并遵循成功(但被终止)的尝试之一时，我发现以下日志:

2017-01-05 10:27:22,772 INFO [AsyncDispatcher event handler] org.apache.hadoop.mapreduce.v2.app.job.impl.TaskImpl: Task succeeded with attempt attempt_1483370705805_4012_m_000000_0
2017-01-05 10:27:22,773 INFO [AsyncDispatcher event handler] org.apache.hadoop.mapreduce.v2.app.job.impl.TaskImpl: task_1483370705805_4012_m_000000 Task Transitioned from RUNNING to SUCCEEDED
2017-01-05 10:27:22,775 INFO [AsyncDispatcher event handler] org.apache.hadoop.mapreduce.v2.app.job.impl.JobImpl: Num completed Tasks: 1
2017-01-05 10:27:22,775 INFO [AsyncDispatcher event handler] org.apache.hadoop.mapreduce.v2.app.job.impl.JobImpl: job_1483370705805_4012Job Transitioned from RUNNING to COMMITTING
2017-01-05 10:27:22,776 INFO [CommitterEvent Processor #1] org.apache.hadoop.mapreduce.v2.app.commit.CommitterEventHandler: Processing the event EventType: JOB_COMMIT
2017-01-05 10:27:23,118 INFO [RMCommunicator Allocator] org.apache.hadoop.mapreduce.v2.app.rm.RMContainerAllocator: Before Scheduling: PendingReds:0 ScheduledMaps:0 ScheduledReds:0 AssignedMaps:1 AssignedReds:0 CompletedMaps:1 CompletedReds:0 ContAlloc:1 ContRel:0 HostLocal:0 RackLocal:0
2017-01-05 10:27:24,125 INFO [RMCommunicator Allocator] org.apache.hadoop.mapreduce.v2.app.rm.RMContainerAllocator: Received completed container container_e116_1483370705805_4012_01_000002
2017-01-05 10:27:24,126 INFO [RMCommunicator Allocator] org.apache.hadoop.mapreduce.v2.app.rm.RMContainerAllocator: After Scheduling: PendingReds:0 ScheduledMaps:0 ScheduledReds:0 AssignedMaps:0 AssignedReds:0 CompletedMaps:1 CompletedReds:0 ContAlloc:1 ContRel:0 HostLocal:0 RackLocal:0
2017-01-05 10:27:24,126 INFO [AsyncDispatcher event handler] org.apache.hadoop.mapreduce.v2.app.job.impl.TaskAttemptImpl: Diagnostics report from attempt_1483370705805_4012_m_000000_0: Container killed by the ApplicationMaster.
Container killed on request. Exit code is 143
Container exited with a non-zero exit code 143

我设置了“mapreduce.map.speculative=false”!

所有 MAP 任务都成功了(distcp 作业没有 REDUCE)，但是 MAPREDUCE 持续了很长时间(几个小时)，然后它成功了，distcp 作业完成了。

我正在运行' yarn 版本'= Hadoop 2.5.0-cdh5.3.1

我应该担心这个吗？是什么导致容器被杀死？任何建议将不胜感激!

最佳答案

那些被杀死的尝试可能是由于投机执行。在这种情况下，没有什么可担心的。

为确保是这种情况，请尝试像这样运行您的 distcp:

hadoop distcp  -Dmapreduce.map.speculative=false ...

你应该停止看到那些被杀死的尝试。

关于Hadoop distcp 作业成功但尝试_xxx 被 ApplicationMaster 杀死，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/41481531/

24

4

0

文章推荐： spring-boot - Docker的环境变量未传递给Spring

Hadoop Distcp - 增加 distcp.dynamic.max.chunks.tolerable 配置和调整 distcp
我正在尝试使用 distcp 在两个 hadoop 集群之间移动数据。大量的小文件需要移动大量的数据。为了让它更快，我尝试使用 -strategy dynamic，根据文档，它“允许更快的数据节点比更
hadoop - 'distcp' 和 'distcp -update' 之间的区别？
有什么区别 hadoop distcp 和 hadoop distcp -update 他们都做同样的工作，只是我们称呼他们的方式略有不同。它们都不会覆盖目标中已经存在的文件。那么两组不同的命令有什么
hadoop - 是否可以在 2 个 Hdfs 目录(单独的集群)之间使用 distcp 来 distcp 文件(逗号分隔)？
我只需要 distcp x 个文件。找不到解决方法。一个想法是将它复制到一个临时目录，然后distcp 该目录。完成后，我可以删除该临时目录。单独的 distcp 命令(针对每个文件)。这可能会
具有不同复制因子的集群之间的hadoop distcp
作为一些背景，我们有 2 个集群，目前用于生产和开发。作为其中的一部分，我们正在将文件(使用 hadoop distcp -update)从生产集群复制到开发集群，这些文件是由实时进程生成的(即它也有
hadoop - 带有文件列表的Hadoop distcp
我想使用distcp将文件列表(> 1K文件)复制到hdfs中。我已经将文件列表存储在本地目录中，现在可以使用-f复制所有文件吗？如果是，我必须在文件列表文件中保留什么格式？还是还有其他更好的方法？
Hadoop distcp 不工作
我正在尝试将数据从一个 HDFS 复制到另一个 HDFS。有什么建议为什么第一个有效但第二个无效？ (作品) hadoop distcp hdfs://abc.net:8020/foo/bar web
带有分区的 Hadoop distcp
我正在尝试从一个系统到另一个具有相同配置的系统(比如 A 到 B)执行 distcp。但是我在 A 中创建的分区在从 A 到 B 的 distcp 后没有显示在 B 中。我必须在 B 中手动创建分区。
Hadoop distcp 异常
我们正在使用 dictcp 将数据从 CDH4 复制到 CDH5。当我们在 CDH5 目标名称节点上运行命令时，我们得到以下异常。如果您已经遇到问题并知道解决方案，请告诉我。谢谢。 5/01/05 1
Hadoop distcp 错误
我正在尝试在两个启用 kerberos 的 hadoop 集群(版本 - Hadoop 2.0.0-cdh4.3.0)之间建立 Hadoop Distcp 当我在目标集群中使用命令“hadoop di
hadoop - Distcp 源长度不匹配
我在两个不同的 hadoop 集群之间执行 distcp 命令时遇到问题， Caused by: java.io.IOException: Mismatch in length of source:h
hadoop - 配置单元覆盖目录移动过程作为 distcp？
当我在配置单元中运行 INSERT OVERWRITE DIRECTORY 查询时，它似乎将结果存储在 .hivexxxx 暂存文件夹中，然后将文件从那里移动到该目录... 在 map reduce
Hadoop Distcp 将目录内的内容复制到同名目录
我在集群 A 中有一个目录:/a/b/c。该目录包含目录“一”、“二”、“三”、...、“九十”。在集群 B 中，我有目录/a/b/c。该目录包含目录“一”。我想将目录“一”到“九十”从集群 A 复制
hadoop - Distcp - 容器运行超出物理内存限制
几天来我一直在与 distcp 作斗争，我发誓我已经用 google 搜索了足够多的东西。这是我的用例: 用例我在某个位置有一个主文件夹，比如 /hdfs/root，里面有很多子目录(深度不固定)和
Hadoop DistCp 通过重命名处理相同的文件名
有什么方法可以运行 DistCp，但可以选择在文件名冲突时重命名？也许用一个例子来解释是最容易的。假设我正在将 hdfs:///foo 复制到 hdfs:///bar，foo 包含这些文件: hdf
Hadoop DistCp 使用通配符？
是否可以使用 DistCp 仅复制与特定模式匹配的文件？例如。对于/foo 我只想要 *.log 文件。最佳答案我意识到这是一个旧线程。但我自己对这个问题的答案很感兴趣——dk89 也在 2013
sockets - 在集群之间运行hadoop distcp -update时发生SocketTimeoutException
我正在使用hadoop distcp -update将目录从一个HDFS集群复制到另一个集群。有时(经常)，我得到这种异常: 13/07/03 00:20:03 INFO tools.DistCp:
hadoop - Hadoop Distcp-在不同位置之间复制时出现小文件问题
我试图复制400+ GB的数据和35.6 GB的数据量，这又是一个distcp作业，但是两者都花了将近2 -3个小时来完成。集群中确实有足够的资源。但是，当我检查了容器日志后，发现复制小文件花费了
hadoop - 如何列出事件的 DISTCP 作业？
如何列出事件的 DISTCP 作业？我正在两个集群之间运行一个 distcp 作业。hadoop distcp hdfs://x/y/x/y 我想持续运行它，但需要确保现有的 distcp 任务已完
hadoop - oozie distcp 操作中的正则表达式
我正在尝试将所有符合特定条件的文件复制到一个文件夹中 ${NAME_NODE}${PATH_COMVERSE}${CURRENT_DATE_NO_DASH}_*/*mta.
Hadoop distcp 错误路径仍然复制——数据去哪儿了？
我正在运行 hadoop distcp 将整个目录 (500GB+) 从 /path/to/source 复制到 /path/to/destination。但是，不是运行 $ hadoop distc

首页

博学

6Ren·AI

商城

Hadoop distcp 作业成功但尝试_xxx 被 ApplicationMaster 杀死