gpt4 book ai didi

hadoop - 如何删除HDFS中超过x天的数据

转载 作者:可可西里 更新时间:2023-11-01 14:57:51 25 4
gpt4 key购买 nike

如何删除早于 x 天的数据。在 linux它非常简单,但是在 hdfs发现困难。

此外甚至hdfs dfs -ls /<path>正在提供未排序的有序数据。

最佳答案

这是执行此操作的代码片段:

days_diff=10
now=$(date +%s)
hdfs dfs -ls /path/todir/ | while read f; do
dir_date=`echo $f | awk '{print $6}'`
filename=`echo $f | awk '{print $8}'`
difference=$(( ( $now - $(date -d "$dir_date" +%s) ) / (24 * 60 * 60 ) ))
if [ $difference -gt $days_diff ]; then
echo "Deleting file:" $filename ;
hdfs dfs -rm $filename;
fi
done

关于hadoop - 如何删除HDFS中超过x天的数据,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/34023020/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com