gpt4 book ai didi

Hadoop 工作负载

转载 作者:可可西里 更新时间:2023-11-01 16:34:47 26 4
gpt4 key购买 nike

我目前在 hadoop 中使用 wordcount 应用程序作为基准。我发现 CPU 使用率几乎保持在 80-90% 左右。我想有一个波动的 cpu 使用率。是否有任何 hadoop 应用程序可以为我提供此功能?非常感谢。

最佳答案

我认为没有办法限制或指定 hadoop 的使用范围。 Hadoop 将使用它可用的 CPU。当我处理大量工作时,我的工作效率一直在 90% 以上。

控制 CPU 使用率的一种方法是更改​​每个 tasktracker 可以同时运行的映射器/缩减器的最大数量。这是通过mapred.tasktracker.{map|reduce}.tasks.maximum$HADOOP_HOME/conf/core-site.xml 中设置。

当 mapper/reducer 的数量有限时,它会在该 tasktracker 上使用较少的 CPU。

另一种方法是在设置作业时为 mapred.tasktracker.{map|reduce}.tasks 设置配置值。这将迫使该作业使用那么多映射器/缩减器。这个数字将分配给可用的 tasktrackers,所以如果你有 4 个节点并希望每个节点有 1 个映射器,你可以将 mapred.tasktracker.map.tasks 设置为 4。也有可能如果一个节点可以运行 4 个映射器,它将运行所有 4 个,我不知道 hadoop 将如何拆分任务,但强制每个作业分配一个数字是一个选项。

我希望这能帮助您到达目的地。我还是不太明白你在找什么。 :)

关于Hadoop 工作负载,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/5748585/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com