gpt4 book ai didi

hadoop - 如何通过保留修改时间将 HDFS 文件从一个集群复制到另一个集群

转载 作者:可可西里 更新时间:2023-11-01 15:27:23 25 4
gpt4 key购买 nike

我必须将一些 HDFS 文件从我的生产集群移动到开发集群。在根据文件修改时间移动到开发集群后,我必须测试对 HDFS 文件的一些操作。需要具有不同日期的文件才能在开发中对其进行测试。

我试着用 DISTCP 做,修改时间正在更新当前时间。我使用在这里找到的许多参数检查了 Distcp distcp version2 guide

有没有其他方法可以在不改变修改时间的情况下获取文件?或者我可以在将文件放入 hdfs 后手动更改修改时间吗?

提前致谢

最佳答案

hadoop distcp 命令中使用 -pt 标志。这将p保留 distcp 文件的 timestamp(修改时间)。

hadoop distcp -pt hdfs://src_cluster/file hdfs://dest_cluster/file

使用 Hadoop-2.7.3 测试

引用最新Distcp Guide

关于hadoop - 如何通过保留修改时间将 HDFS 文件从一个集群复制到另一个集群,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/42094895/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com