gpt4 book ai didi

hadoop - HDFS 如何在磁盘上分配存储空间

转载 作者:可可西里 更新时间:2023-11-01 17:01:15 30 4
gpt4 key购买 nike

我很好奇HDFS是如何在Data节点上预留和分配存储空间的。

假设我在其中一个数据节点中有 500GB 的硬盘,其中 400GB 分配给/data 分区,据说 hadoop 就放在上面。

此处 hadoop 守护进程将占用 400GB 中的多少空间来存储输入拆分( block )。

它是预先保留所有存储空间还是按需分配?

并且还想知道在设置集群时格式化名称节点是否与此有关。

非常感谢...

最佳答案

dfs.datanode.data.dir 属性决定了 DFS 数据节点应该在本地文件系统中的什么地方存储它的 block 。如果这是一个逗号分隔的目录列表,那么数据将存储在所有命名的目录中,通常在不同的设备上。不存在的目录将被忽略。

DataNode 上的每个 block 副本由本地 native 文件系统中的两个文件表示。第一个文件包含数据本身,第二个文件记录 block 的元数据,包括数据的校验和和生成戳。数据文件的大小等于 block 的实际长度,并且不需要额外的空间来将其四舍五入到传统文件系统中的标称 block 大小。因此,如果一个 block 是半满的,它只需要本地驱动器上完整 block 空间的一半。

名称节点格式步骤在此链接中进行了说明,您可以引用此 Link

关于hadoop - HDFS 如何在磁盘上分配存储空间,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/23821755/

30 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com