linux - "find"命令检测不到执行过程中添加的文件-6ren

linux - "find"命令检测不到执行过程中添加的文件

转载作者：太空狗更新时间：2023-10-29 12:12:42

27

4

多年来，Stackoverflow 无数次救了我的命。现在，是时候发布我的第一个问题了，到目前为止我一直找不到答案。

我有一个接受文本文件作为输入的工具(语言/实现无关紧要)。这个文本文件(我们称之为 file_list.txt)包含一长串文件路径，每行一个。然后该工具遍历 file_list.txt 中的行并对每个文件路径执行一些操作。这需要不断地完成，并且 file_list.txt 需要始终包含最新的文件路径，因为用户不断地从被监控的共享中上传或删除文件。为此，我设置了一个调用脚本的 cron 作业。首先，脚本使用所需的搜索参数调用 find 实用程序，并将输出通过管道传输到一个临时文件。当文件完全填充时，它被移动到 file_list.txt。然后，一旦完成，将使用 file_list.txt 作为输入参数调用该工具。

到目前为止，还不错。被监控的共享非常大(约 60 TB)，执行查找命令大约需要 5 个小时。这不是问题，因为我们有多个并行运行的重叠查找命令(每小时触发一次)。整个设置在计算场上运行，因此 CPU 利用率等也不是问题。

问题出现在文件检测的延迟时间上。理想情况下，我希望用户添加一个文件，并且我希望其中一个已经在运行的重叠查找命令能够在几分钟内检测到该文件。但是，我注意到所有已运行的查找命令都不会检测到该文件。只有在添加此文件AFTER 后启动的查找命令才能检测到它。这意味着通常，我需要等待大约 5 个小时才能检测到新添加的文件。这使我相信 find 实用程序在触发时以某种方式作用于共享状态的“缓存”版本。这是真的？谁能证实这一点？如果是这样，我可以做些什么来改善检测延迟？

如果需要进一步说明，请告诉我。我很乐意提供任何进一步的细节。

最佳答案

总结一下:您有一个巨大的文件系统卷 (60 TB)，其中包含大量文件，您使用 find(1) 来命名大量这些文件并将这些名称放入到一个文本文件中进行分析。您已经发现，如果文件是在 find(1) 启动之后但在完成之前创建的，则不会列出这些文件。

我认为最好的解决方案是停止将其视为批处理作业，并使用 inotify(7) 在线完成.您可以使用 inotify API 立即获知文件系统的更改，包括正在创建的新文件。当然有原始的 C API，以及优秀的 pyinotify .

使用 inotify，您可以启动一个观察程序一次并让它持续运行(如果需要重新启动，则在监督程序下运行)。然后，操作系统可以在相关文件系统事件发生时通知您，您可以立即响应，而不必等待下一次扫描。

您的用例的一个缺点可能是观察程序确实需要在本地安装了文件系统的机器上运行。但所需的总体计算资源可能比您当前的重复线性扫描方法少得多。

关于linux - "find"命令检测不到执行过程中添加的文件，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/36845583/

27

4

0

文章推荐： html - 如何使整个下拉菜单居中？

文章推荐： c - 错误写入同步进程的文件输出顺序？

文章推荐： html - 如何使用 CSS 创建自定义三 Angular 形

fortran - 在 PURE 过程 Fortran 中调用类型绑定(bind)过程
如果我声明了类似的类型 type test(NSIZE) integer, len :: NSIZE real :: dummy(NSIZE) contains procedure,
vba - 从 Excel 应用程序隐藏 VBA 过程，但不从其他项目隐藏 VBA 过程
我知道这是一个不太可能的事情，但是由于“选项私有(private)模块”的限制，甚至更糟糕的“私有(private)子/函数”的限制，有谁知道是否有一种方法可以从 Excel 应用程序隐藏 VBA 过
SQL 过程 - 根据其他表的计数更改表列的值
我有两个表，property 和 component。 component.id_property = property.id。我正在尝试创建一个过程，该过程对所选属性的组件进行计数，如果所选属性没
在一行中返回结果的 SQL 过程
我有一份报告，它是在 SSRS 2005 中开发的，我正在使用存储过程从数据库中获取结果。报告输出的结果非常简单，如下图所示。如果假设我正在寻找不同的成员例如:- MemberID c108 c
delphi - 衰落值常规功能/过程
我需要一个通用函数/过程，该函数/过程将根据提供的数据计算出我的淡入淡出时间和值，如下所示：我将字节值保存在字节数组中：这些是起始值。然后，我在其他数组中存储了一些值：这些将是新值。然后我有时间要提
java - 如何在java中为多个按钮设置相同的操作/过程
我想在界面的多个按钮上创建相同的操作。是否只能通过创建单独的操作监听器方法并调用执行操作的方法才可行，还是还有其他方法？是否可以将按钮放在一个组中并执行以下操作:- groupButton.setOn
delphi - 跳转到finally而不退出函数/过程
我有以下情况: procedure Test; begin repeat TryAgain := FALSE; try // Code // Code if this an
Oracle 向一个对象类型添加一个新的成员函数/过程
我正在尝试执行以下操作；假设我在 Oracle 中创建了一个对象类型 create type test as object( name varchar2(12), member procedure p
VHDL - 适用于任何类型数组的函数/过程
问题: 如果可能的话，如何声明一个用于任何类型参数的函数 T其中 T 的唯一约束是它被定义为 1D array如 type T is array ( integer range <> ) of a_r
包含一整年的天数和小时数的 Mysql 过程
我正在尝试创建这个 mysql 过程来制作一个包含今年所有日期和所有时间的表(以一小时为间隔。) CREATE TABLE FECHAS ( created_at datetime ); CREA
带有预选光标数据的 MySQL 过程
所以，我在这里面临一个问题，这让我发疯，我认为这是一个愚蠢的错误，所以我不是 MySQL 的新手，但它并不像我想象的那样工作。尝试将此语句部署到 MySQL 后，我收到此错误: ERROR 106
带参数语法的 MySQL 过程
我有一个架构，其中包含星球大战中的人物列表、他们出现的电影、他们访问的行星等。这是架构: CREATE DATABASE IF NOT EXISTS `starwarsFINAL` /*!40100
具有多个计数和分组依据的 MySql 过程
我一直在为一家慈善机构创建一款应用程序，允许家庭在节日期间注册接收礼物。数据库组织有多个表。下面列出了这些表(及其架构/创建语句): CREATE TABLE IF NOT EXISTS ValidD
mysql - 按日期删除表而不删除系统表的函数/过程
正如上面标题所解释的，我正在尝试编写一个sql函数来按日期删除表而不删除系统表。我在此消息下方放置了一张图片，以便直观地解释我的问题。任何帮助将不胜感激!感谢您的时间! 最佳答案您可以通过查询INF
使用游标的 mysql 过程
DELIMITER $$ CREATE PROCEDURE INSERT_NONE_HISTORY_CHECKBOX() BEGIN DECLARE note_id bigint(20); F
postgresql 过程/触发器
是否可以编写一个存储过程或触发器，在特定时间在数据库内部自动执行，而无需来自应用程序的任何调用？如果是，那么任何人都可以给我一个例子或链接到一些我可以阅读如何做到这一点的资源。最佳答案查看 pgA
mysql 过程 - 在第二个查询中使用结果并重新格式化日期
我需要创建一个过程:1)从表中的字段中选择一些文本并将其存储在变量中2) 更新相同的记录字段，仅添加 yyyymmdd 格式的日期以及过程中的附加文本输入...类似这样的... delimiter /
MySQL 过程 - 如果不存在则插入行
好的，这就是我想做的: 如果条目已存在(例如基于字段name)，则只需返回其id 如果没有，请添加这是我迄今为止所管理的(对于“如果不存在，则创建它”部分): INSERT INTO `object
MySQL 过程 - 开始工作
以下是我编写的程序，用于找出每位客户每天购买的前 10 件商品。这是我尝试过的第一个 PL/SQL 操作。它没有达到我预期的效果。我使用的逻辑是接受开始日期、结束日期以及我对每个客户感兴趣的前“x
mysql - 列不能为空 - 过程
我正在尝试在MySQL中创建一个过程那insert week s(当年)发送至我的 week table 。但存在一个问题，因为在为下一行添加第一行后，我收到错误: number column can

首页

博学

6Ren·AI

商城

linux - "find"命令检测不到执行过程中添加的文件