gpt4 book ai didi

hadoop - 有没有办法看到sqoop已完成写入文件?

转载 作者:行者123 更新时间:2023-12-02 21:06:24 27 4
gpt4 key购买 nike

假设一个sqoop作业正在将增量导入写入hdfs目录。
另一个(非同步)作业是定期将数据从该目录移至其他位置进行处理。
我希望这项工作现在不移动由sqoop修改的文件。一旦可以移动准备好的文件,是否可以将它们重命名为某种模式?

如果不移动文件,sqoop是否每次都会将新内容追加到现有的part-m-000x文件中?

最佳答案

查看Ambari / HDFS上传过程如何工作。当您将文件上传到hdfs时,在文件“xxxx.txt”的上传过程中,Ambari会将其上传为“xxxx.txt._COPYING”。上传完成后,只需将文件重命名为正确的名称。

如果您的其他sqoop进程搜索“.txt”文件,则在重命名并因此完成并准备将其移动之前将看不到该文件。

过去曾做过,效果很好。

关于hadoop - 有没有办法看到sqoop已完成写入文件?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/41742502/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com