gpt4 book ai didi

hadoop - 使用 jar 选项将作业提交到不同的公平调度程序池

转载 作者:可可西里 更新时间:2023-11-01 14:59:32 28 4
gpt4 key购买 nike

我是 Hadoop 的新手,尝试在运行时使用 hadoop jar 选项将同一用户的不同作业提交到公平调度程序的不同池。

基于 http://osdir.com/ml/hive-user-hadoop-apache/2009-03/msg00162.html 中的解决方案,我在运行作业时使用了 -D 选项。

具体来说,我运行了命令:bin/hadoop jar hadoop-examples-1.0.4.jar grep input output 'dfs[a-z.]+' -D pool.name=sample_pool

我可以在作业跟踪器调度程序页面中看到池,但作业仍提交给用户池。我发现 jar 选项不支持 -D 选项:http://hadoop.apache.org/docs/r1.0.4/commands_manual.html#job .

如何在运行时指定它?

最佳答案

一些建议:

  • 在进行了第一个链接中建议的更改后,您是否重新启动了作业跟踪器?
  • 您之前需要在其他参数之前设置所有 -D 属性(我不确定这在最近的版本中是否有所改变)。尝试:

    bin/hadoop jar hadoop-examples-1.0.4.jar -Dpool.name=sample_pool grep 输入输出 'dfs[a-z.]+'

如果可能无关紧要,但我总是将 -Dkey=value 选项组合起来(-Dkey=value 之间没有空格),我发现它更明显地表明这不是变量 args 列表的一部分。

验证是否已正确选择的一种方法是在作业跟踪器中检查作业的 job.xml - 它是否列出了 pool.name 属性,它是否具有您配置的值。

编辑 只需阅读示例如何捆绑,您就需要在程序名称之后和其他参数之前添加 -D:

`bin/hadoop jar hadoop-examples-1.0.4.jar grep -Dpool.name=sample_pool input output 'dfs[a-z.]+' `

关于hadoop - 使用 jar 选项将作业提交到不同的公平调度程序池,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/13349630/

28 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com