gpt4 book ai didi

hadoop - HDFS block 大小和网络复制流量之间有什么关系?

转载 作者:可可西里 更新时间:2023-11-01 14:53:05 24 4
gpt4 key购买 nike

相对于我们认为通过 OpenTSDB 写入的数据量,我们的 HBase 集群有大量的网络流量。

将字节中继到 OpenTSDB:

enter image description here

字节为单位的网络吞吐量(Y 轴是 SI 单位,因此不是 base2):

enter image description here

我们使用 Cloudera,所以 block 是 128MB,将其更改为 64MB 会减少网络复制流量吗?是否还有其他后果需要考虑?

最佳答案

要清楚地回答降低 block 大小会减少复制流量的问题,答案是不会

HDFS 客户端不会一次写入整个 block 的数据 - 它们一次将写入流化为 64k-128k 字节的小校验和数据包(可配置),在管道中的 DataNode(s) 上构建整个 block .

降低 block 大小只会产生一种效果:更多数据节点上的更多 block 。它不会改变传输速率和总网络利用率,这完全由目标数据写入大小和复制因子驱动​​,而不是由 HDFS 逻辑 block 大小属性驱动。

关于hadoop - HDFS block 大小和网络复制流量之间有什么关系?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/31878814/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com