gpt4 book ai didi

python - 如何在Python中按修改日期顺序遍历目录而不至少访问目录中的所有文件一次

转载 作者:行者123 更新时间:2023-12-01 04:55:31 24 4
gpt4 key购买 nike

我有一个目录,其中可能包含数百万个文件。这些文件在使用时会“标记”自己,然后我的Python程序想要找到“标记”的文件,然后记录它们已被标记并取消标记。它们是单独的 html 文件,因此在此标记过程中它们无法轻松地与 python 程序本身进行通信(用户只需打开他们选择的任何文件)。

因为它们在使用时被标记,如果我按修改日期访问它们,一次一个,一旦我到达一个未标记的我就可以停止(或者至少一旦我到达一个被修改了相当数量的 future 的时间)。然而,all ways我有seen到目前为止,这样做需要至少访问每个文件的元数据一次,然后对这些数据进行排序,这对于我拥有的文件大小来说并不理想。请注意,此检查发生在更新步骤期间,更新步骤大约每 5 秒发生一次,并与其他工作结合使用,因此理想情况下时间需要独立于目录中的文件数量。

那么有没有一种方法可以按修改日期顺序遍历目录,而无需在 Python 中至少访问一次所有文件的元数据?

最佳答案

不,我认为没有办法以按修改日期排序的 block 的形式获取文件名。

您应该使用文件系统通知来了解已修改的文件。

例如使用 https://github.com/gorakhargosh/watchdoghttps://github.com/seb-m/pyinotify/wiki

关于python - 如何在Python中按修改日期顺序遍历目录而不至少访问目录中的所有文件一次,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/27498209/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com