gpt4 book ai didi

python - os.listdir() 在非常大的文件夹上如何执行?

转载 作者:行者123 更新时间:2023-11-30 21:53:07 26 4
gpt4 key购买 nike

我计划获取一个巨大的数据文件夹。该文件夹的总大小约为 2TB,包含约 200 万个文件。我需要对这些文件进行一些处理(主要是删除其中 99%)。

我预计由于数据大小会出现一些问题。特别是,我想知道 Python 是否能够在合理的时间内使用 os.listdir() 正确列出这些文件。

例如,根据我的经验,在某些情况下,在 Ubuntu 上删除像这样的大文件夹可能会很痛苦。

最佳答案

os.scandir 已创建 largely because of issues with using os.listdir on huge directories ,所以我预计 os.listdir 会在您描述的场景中受到影响,其中 os.scandir 应该表现更好,因为它可以处理内存消耗较低的文件夹,并且因为(通常)通过避免每个条目的 stat 调用(例如,区分文件和目录),您至少会受益一点。

关于python - os.listdir() 在非常大的文件夹上如何执行?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/59749854/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com