gpt4 book ai didi

hadoop - 如何保存 YARN 的日志文件?

转载 作者:可可西里 更新时间:2023-11-01 14:10:47 28 4
gpt4 key购买 nike

突然,我的 YARN 集群停止工作,我提交的所有内容都失败并显示“退出代码 1”。我想找出那个问题,但一旦应用程序失败,YARN 就会删除日志文件。我必须为 YARN 调整什么配置设置才能保留这些日志文件?

最佳答案

您的容器似乎正在退出,退出代码为 1。

您无法在 UI 上看到日志,因为默认情况下,日志聚合是禁用的。以下参数确定日志聚合:“yarn.log-aggregation-enable”(如果禁用日志聚合,则设置为“false”)。

如果设置为“false”,则所有节点管理器都将容器日志存储在本地目录中,该目录由以下配置参数决定:“yarn.nodemanager.log-dirs”。

例如在我的例子中,这被设置为:

  <property>
<name>yarn.nodemanager.log-dirs</name>
<value>e:\hdpdata\hadoop\logs</value>
</property>

因此,我的特定应用程序的所有容器日志都将在节点管理器机器的文件夹“e:\hdpdata\hadoop\logs\{application-id}\{container-id}”中找到,其中Application Master 运行。

假设我的应用程序:“application_1443377528298_0010”失败。在 YARNRM 的 UI 中(由配置参数确定:yarn.resourcemanager.webapp.address),您可以获得有关运行应用程序管理器的节点的信息。在下图中,应用程序管理器在机器“120243”上运行。 enter image description here

如果你登录 native ,在文件夹“e:\hdpdata\hadoop\logs\application_1443377528298_0010\”中搜索,可以看到应用程序“application_1443377528298_0010”的所有容器的日志。

但是,现在如果你想通过 YARN RM web UI 查看日志,那么你需要启用日志聚合。为此,您需要在 yarn-site.xml 中设置以下参数:

  <property>
<name>yarn.log-aggregation-enable</name>
<value>true</value>
</property>
<property>
<name>yarn.nodemanager.remote-app-log-dir</name>
<value>/app-logs</value>
</property>
<property>
<name>yarn.nodemanager.remote-app-log-dir-suffix</name>
<value>logs</value>
</property>

通过上述设置,我的日志被聚合在“/app-logs/{username}/logs/”的 HDFS 中。在此文件夹下,您可以找到到目前为止运行的所有应用程序的日志。同样,日志保留由配置参数“yarn.log-aggregation.retain-seconds”(保留聚合日志的时间)决定。

当 MapReduce 应用程序运行时,您可以从 YARN 的 Web UI 访问日志。应用程序完成后,日志将通过 Job History Server 提供。

在您的情况下,如果您想在 Web UI 上查看日志,则在应用程序终止后,您还需要开始运行 MapReduce Job History 服务器。要启用它,请在 mapred-site.xml 中设置以下配置参数:

  <property>
<name>mapreduce.jobhistory.address</name>
<value>{job-history-hostname}:10020</value>
</property>
<property>
<name>mapreduce.jobhistory.webapp.address</name>
<value>{job-history-hostname}:19888</value>
</property>

并在 yarn-site.xml 中设置如下配置参数:

  <property>
<name>yarn.log.server.url</name>
<value>http://{job-history-hostname}:19888/jobhistory/logs</value>
</property>

我已经从 Windows 上的 HDP 安装复制了设置,这些设置对我有用。这些也应该对你有用。上述各项配置的说明,请引用以下链接:

https://hadoop.apache.org/docs/r2.4.1/hadoop-yarn/hadoop-yarn-common/yarn-default.xml

https://hadoop.apache.org/docs/current/hadoop-mapreduce-client/hadoop-mapreduce-client-core/mapred-default.xml

关于hadoop - 如何保存 YARN 的日志文件?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/32713587/

28 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com