gpt4 book ai didi

hadoop - 如何配置和重新启动在 Azure 上运行的 HDInsight 群集?

转载 作者:可可西里 更新时间:2023-11-01 15:17:30 25 4
gpt4 key购买 nike

具体来说,我想更改在 Microsoft Azure 上运行的 HDInsight 集群中每个节点的最大映射器数量和最大缩减器数量。

我使用远程桌面登录到头节点。我编辑了头节点上的 mapred-site.xml 文件并更改了 mapred.tasktracker.map.tasks.maximum 和 mapred.tasktracker.reduce.tasks.maximum 值。我尝试重新启动头节点,但无法重新启动。我使用 start-onebox.cmd 和 stop-onebox.cmd 脚本来尝试启动/停止 HDInsight。

然后我运行了一个流式 mapreduce,将所需数量的 reducer 传递给 hadoop-streaming.jar,但 reducer 的数量仍然受到 mapred.tasktracker.reduce.tasks.maximum 先前值的限制。我的大部分 reducer 都在等待执行。

是否需要更改每个节点上的 mapred-site.xml 文件?有没有简单的方法来改变这个,或者我需要远程桌面进入每个节点?如何重新启动或重新启动集群以便使用我的新值?

谢谢

最佳答案

我知道问题发布已经有一段时间了,但我想为其他可能觉得有用的用户发布。

有两种方法可以在 HDinsight 上更改 Hadoop 配置文件(例如 mapred-site.xml、hive-site.xml 等)

选项 #1:这是最简单的 - 您可以为每个作业提供 hadoop 配置值,如本 blog 所示。

选项 #2:您可以在配置或安装集群期间使用 hadoop 配置值自定义 HDInsight 集群,如本 blog 所示。

不支持手动修改配置文件,当 Azure VM 重新镜像时更改将丢失。

关于hadoop - 如何配置和重新启动在 Azure 上运行的 HDInsight 群集?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/17343646/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com