gpt4 book ai didi

Hadoop:永久删除文件所需的时间?

转载 作者:可可西里 更新时间:2023-11-01 15:36:10 25 4
gpt4 key购买 nike

我有一个包含大约 300 GB 数据的目录,该目录可能也被复制了 3 次。

我刚刚使用 hadoop dfs -rmr 删除了文件,我想知道 Hadoop 删除文件的过程是什么?几秒钟后我收到一条消息说它已被删除,但实际空间需要多长时间才能清理 300GB 和复制的碎片?

我使用的是 Hadoop 版本 0.20.2

谢谢

最佳答案

hadoop 文件系统处理删除操作的方式与文件传输到 HDFS 时创建 block 的方式相同。 hadoop dfs -rmr shell 命令由名称节点接收,名称节点保存关于文件分配 block 的元数据。删除操作被通知到相应的数据节点,然后删除 block 及其在磁盘上的复制​​。

如果在非 HDFS 上的一个简单文件上运行该操作将花费大量时间,但由于我们处于分布式环境中,所涉及的时间减少了很多倍,比如一个 1000 GB 的文件在单个非 HDFS 上需要 100 秒HDFS,在 10 个数据节点 HDFS 上需要 10 秒。希望对您有所帮助。

关于Hadoop:永久删除文件所需的时间?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/25099190/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com