gpt4 book ai didi

hadoop - 调整 Hadoop 参数

转载 作者:可可西里 更新时间:2023-11-01 15:19:59 25 4
gpt4 key购买 nike

有没有一种方法可以微调 Hadoop 配置参数,而不必为每种可能的组合运行测试?我目前正在一个 8 节点集群上工作,我想优化 map reduce 任务的性能以及 spark 性能(在 hdfs 上运行)。

最佳答案

简短的回答是否定的。您需要尝试并运行冒烟测试以确定集群的最佳性能。所以我会先检查这些

链接:

讨论的一些会影响 MapReduce 作业的主题:

  • 配置 HDFS block 大小以获得最佳性能
  • 避免使用小于 block 大小的文件
  • 调整 DataNode JVM 以获得最佳性能
  • 启用 HDFS 短路读取
  • 避免从陈旧的 DataNode 读取或写入

让您了解如何在 YARN/TEZ 中设置每个节点集群的 4 节点 32 核 128GB RAM:(来自 Hadoop multinode cluster too slow. How do I increase speed of data processing?)

对于 Tez:除以 RAM/CORES = 最大 TEZ 容器大小所以在我的例子中:128/32 = 4GB

技术研究中心: enter image description here


yarn :

我喜欢使用 YARN 运行我可以为每个节点腾出的最大内存,我的内存比建议的要高一点,但建议的值会导致 TEZ/MR 作业崩溃,所以 76GB 更适合我的情况。您需要使用所有这些值!

enter image description here

关于hadoop - 调整 Hadoop 参数,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/55764777/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com