gpt4 book ai didi

apache-nifi - ListFile 处理器,强制处理器每次都列出完整的目录

转载 作者:行者123 更新时间:2023-12-01 02:30:04 26 4
gpt4 key购买 nike

我的用例。

在其他地方进行的一些处理将文件添加到某个目录 (_use_it) -> 使用 REST 调用我的流程 -> 现在我希望我的进程从提到的目录 (_use_it) 中读取所有文件。

我想每次都从这个目录中读取所有文件,而不仅仅是更改/添加的文件。我无法启动/停止进程。此流程必须作为后台进程运行。

我想,我正在寻找 ListFile 处理器运行一次,然后停止,然后当它再次运行时,它会忘记以前的状态。 “一些扭曲的逻辑”:)

谢谢

最佳答案

1.使用 GetFile 处理器:

您可以使用 GetFile 处理器代替 ListFile + FetchFile 处理器 并且 GetFile 处理器不存储状态.

  • GetFile处理器每次获取目录下的所有文件。

  • Keep Source File 属性如果true,文件不删除之后已复制到内容存储库;这导致文件是不断拾起,可用于测试目的。如果不保留原始 NiFi 将需要对其目录的写入权限正在从中提取,否则它将忽略该文件。

(或)

2。使用 ListFile 处理器:

利用NiFi RestAPI我们可以清除列表文件处理器的状态,然后处理器每次都会列出目录中的所有文件。

处理器的清除状态:

POST 
/processors/{id}/state/clear-requests

在开始列出目录中的所有文件流之前

  1. 使用 Rest Api 停止 ListFile 处理器

  2. 清除ListFile处理器的状态

  3. 启动 ListFile 处理器。

引用thisthis通过 RestApi 停止处理器的链接

关于apache-nifi - ListFile 处理器,强制处理器每次都列出完整的目录,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/52269202/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com