gpt4 book ai didi

hadoop - 在哪里找到M/R配置文件并更新它

转载 作者:行者123 更新时间:2023-12-02 21:41:46 26 4
gpt4 key购买 nike

我们的Hadoop集群显示作业跟踪程序进程逐渐消耗了内存,我们必须每周重新启动集群。我到处寻找可能的解决方案。提到的其中一篇文章将'mapred.jobtracker.completeuserjobs.maximum'减少到5,因此我检查了名称节点上/ hadoop-install / conf目录下的mapred-site.xml,发现该参数有两个条目,一组它设置为30,另一个设置为5,当我转到任何数据节点并检查mapred-site.xml时,我根本找不到该参数的设置。但是,当我在M / R管理页面上检查正在运行的作业并检查其作业文件时,它显示参数设置为100。我真的很困惑在何处设置此参数。如果我更新了它,是否需要重启集群?我们正在Google Cloud上运行apache Hadoop 1.2.1

最佳答案

Hadoop不会自动将配置文件从驱动程序计算机复制到所有群集计算机,您需要通过scp和/或rsync或最好使用自动部署工具(例如Chef,ansible,puppet等)来完成此操作。

至于各个作业参数:实际上,您可以使用-D在每个作业的基础上进行设置:

<path to jar>/myHadoopJobJar.jar  -Dmapred.jobtracker.completeuserjobs.maximum=5

关于hadoop - 在哪里找到M/R配置文件并更新它,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/28243613/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com