gpt4 book ai didi

hadoop - 为什么三节点集群的性能比单节点集群差?

转载 作者:可可西里 更新时间:2023-11-01 16:37:45 26 4
gpt4 key购买 nike

我用多个文件运行了多个测试。 (最大文件为 83.7 MB)

我知道网络会带来一些开销,但我期待更好的结果,因为我认为使用分布式系统的目的是减少响应时间。

我用/usr/bin/time 来衡量性能。这里有什么问题?

最佳答案

如果您的 mapreduce key 被发送到集群中的单个节点,那么与单个节点相比,您不会获得性能提升并且您会增加数据洗牌的网络开销

如果您没有为您的硬件调整 mapreduce YARN 容器大小,那么您会看到性能不佳。

如前所述,如果您存储的大量文件小于 HDFS block 大小(128 MB,如果您保留默认值),那么您就是在浪费资源。此外,如果您正在处理单个大文件,如 ZIP 或其他“不可拆分”文件格式,则与单个映射器节点相比,您没有任何优势。

I measure performance with /usr/bin/time

MapReduce 作业输出和历史服务器都会告诉您作业及其任务实际需要多长时间

关于hadoop - 为什么三节点集群的性能比单节点集群差?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/48424260/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com