gpt4 book ai didi

apache-nifi - GetFile 处理器在 Apache NiFi 中持续运行

转载 作者:行者123 更新时间:2023-12-05 00:17:15 25 4
gpt4 key购买 nike

我正在使用 Apache NiFi 将一些本地文件复制到 HDFS。
我创建了一个 GetFile处理器绑定(bind)到 PutHDFS处理器。 GetFile处理器递归查询 只读 目录。我遇到的问题是文件被不断复制,例如,如果我在 HDFS 上删除复制的文件,那么它们很快就会重新出现。

GetFile处理器配置,我设置了Keep Source File真实 因为该目录是只读的,并且在 documentation 中指定在只读目录中,如果此参数设置为 然后文件被忽略:

If true, the file is not deleted after it has been copied to the Content Repository; this causes the file to be picked up continually and is useful for testing purposes. If not keeping original NiFi will need write permissions on the directory it is pulling from otherwise it will ignore the file.



是否可以简单地将每个文件复制一次?

最佳答案

您可以使用 ListFileFetchFile处理器来做到这一点。 ListFile 将跟踪它到目前为止看到的文件,除非它们被修改,否则不会继续列出它们。确保将 FetchFile 中的完成策略设置为“无”,以确保不会尝试移动/删除文件。

关于apache-nifi - GetFile 处理器在 Apache NiFi 中持续运行,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/40586370/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com