python - 为什么 os.scandir() 和 os.listdir() 一样慢？-6ren

python - 为什么 os.scandir() 和 os.listdir() 一样慢？

转载作者：行者123 更新时间：2023-12-03 11:06:43

27

4

我尝试在 Windows 上使用 os.scandir() 而不是 os.listdir() 来优化用 Python 编写的文件浏览功能。但是，时间保持不变，大约2分半钟，我不知道为什么。
以下是原始和修改的功能:

os.listdir() 版本:

def browse(self, path, tree):
    # for each entry in the path
    for entry in os.listdir(path):
        entity_path = os.path.join(path, entry)
        # check if support by git or not
        if self.git_ignore(entity_path) is False:
            # if is a dir create a new level in the tree
            if os.path.isdir( entity_path ):
                tree[entry] = Folder(entry)
                self.browse(entity_path, tree[entry])
            # if is a file add it to the tree
            if os.path.isfile(entity_path):
                tree[entry] = File(entity_path)

os.scandir() 版本:

def browse(self, path, tree):
    # for each entry in the path
    for dirEntry in os.scandir(path):
        entry_path = dirEntry.name
        entity_path = dirEntry.path
        # check if support by git or not
        if self.git_ignore(entity_path) is False:
            # if is a dir create a new level in the tree
            if dirEntry.is_dir(follow_symlinks=True):
                tree[entry_path] = Folder(entity_path)
                self.browse(entity_path, tree[entry_path])
            # if is a file add it to the tree
            if dirEntry.is_file(follow_symlinks=True):
                tree[entry_path] = File(entity_path)

此外，这里是其中使用的辅助功能:

def git_ignore(self, filepath):
    if '.git' in filepath:
        return True
    if '.ci' in filepath:
        return True
    if '.delivery' in filepath:
        return True
    child = subprocess.Popen(['git', 'check-ignore', str(filepath)],
                         stdout=subprocess.PIPE,
                         stderr=subprocess.PIPE)
    output = child.communicate()[0]
    status = child.wait()
    return status == 0

============================================================

class Folder(dict):
    def __init__(self, path):
        self.path = path
        self.categories = {}

============================================================

class File(object):
    def __init__(self, path):
        self.path = path
        self.filename, self.extension = os.path.splitext(self.path)

有没有人可以解决如何使函数运行得更快的解决方案？我的假设是在开始时提取名称和路径使它运行得比它应该的慢，这是正确的吗？

最佳答案

关于你的问题:
os.walk 似乎调用 stats 的次数超过了必要的次数。这似乎是它比 os.scandir() 慢的原因。
在这种情况下，我认为提高速度性能的最佳方法是
使用并行处理，在某些循环中可以令人难以置信地提高速度。
关于这个问题有很多帖子。这里一:
Parallel Processing in Python – A Practical Guide with Examples .

尽管如此，我还是想分享一些关于它的想法。
我也一直在想什么是最佳用法这三个选项(scandir、listdir、walk)。关于性能比较的文档并不多。可能最好的方法是像你一样自己测试它。这是我的结论:
os.listdir() 的用法:
与 os.scandir() 相比，它似乎没有优势，只是更容易理解。当我只需要列出目录中的文件时，我仍然使用它。
优点:

快速简单

缺点:

太简单了，仅适用于列出目录中的文件和目录，因此您可能需要将其与其他方法结合使用以获得有关文件元数据的额外功能。如果是这样，最好使用 os.scandir()。

os.walk() 的用法:
当我们需要获取目录(和子目录)中的所有项目时，这是最常用的函数。
优点:

这可能是遍历所有项目路径和名称的最简单方法。

缺点:

似乎调用 stats 的次数比必要的要多。这似乎是它比 os.scandir() 慢的原因。

尽管它为您提供了文件的根部分，但它不提供 os.scandir() 的额外元信息。

os.scandir() 的用法:
它似乎(几乎)两全其美。它为您提供简单的速度 os.listdir 具有额外的功能，可以让您
简化您的循环，因为您可以避免使用 exiftool 或其他元数据工具
当您需要有关文件的额外信息时。
优点:

快速地。与 os.listdir() 速度相同

非常好的附加功能。

缺点:

如果你想深入研究子文件，你需要创建另一个函数来扫描每个子目录。这个函数非常简单，但在这种情况下使用 os.walk 可能会更 Pythonic(我只是指更优雅的语法)。

这就是我阅读并使用它们后的看法。我很高兴得到纠正，所以我可以了解更多。

关于python - 为什么 os.scandir() 和 os.listdir() 一样慢？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/59268696/

27

4

0

文章推荐： windows - 如何在 Windows 中禁用软件 SMI(系统管理中断)

文章推荐： ios - 无法在 Windows 的 Web 应用程序中调试 iOS 问题？

python - : os. listdir ('.' ) 与 os.listdir() 有什么区别
对于os库有什么区别 os.listdir('.') 与 os.listdir() 它们似乎都产生相同的结果(事件目录中所有内容的列表)但是: https://www.tutorialspoint.c
Python:方法 listdir 在哪里，因为模块 os.py 中没有 "def listdir()"？
Python:我想知道listdir这个方法在哪里，因为他不在模块os.py中。在这个模块中没有方法: def listdir () 最佳答案 listdir方法实际上是在C模块中实现的，根据操作系统
Python中os.listdir()函数的详细用法及代码示例
在Python的文件和目录操作中，os.listdir()函数是一个非常实用的函数。它可以返回指定目录下的所有文件和文件夹的名称列表，帮助我们进行文件的遍历、搜索和批量处理等操作。本文将深入探讨os.
python - listdir 不能正确打印非英文字母
在 Python 2.7 上， for dir in os.listdir("E:/Library/Documents/Old - Archives/Case"): print dir 打印出来
解决python中os.listdir()函数读取文件夹下文件的乱序和排序问题
1. os.listdir()概述 os.listdir() 方法用于返回指定的文件夹包含的文件或文件夹的名字的列表。例如： ?
python - 检查目录是否为空而不使用 os.listdir
我需要一个函数来检查一个目录是否为空，但它应该尽可能快，因为我将它用于数千个目录，最多可以有 100k 个文件。我实现了下一个，但看起来 python3 中的 kernel32 模块有问题(我在 Fi
python - os.listdir() 给出的列表比预期的要大
我的书说: Calling os.listdir(path) will return a list of filename strings for each file in the path argu
Python os.listdir 没有给出一致的输出
我在 Linux Ubuntu 18.04 上的 Conda 虚拟环境中使用 Python 3.6.2。我尝试了多种方法来列出特定路径的文件和目录，但我尝试的每种方法似乎只列出目录中的文件，而不是文
python - os.listdir() 使用什么方法获取目录中的文件列表？
我正在开发一个项目，我必须编辑大约 400 个不同文件中的几行内容。它们都在同一个文件夹中，并且每个都有唯一的名称。为了这个问题，我将它们称为fileName001.conf至fileName420.
python - os.listdir() 在非常大的文件夹上如何执行？
我计划获取一个巨大的数据文件夹。该文件夹的总大小约为 2TB，包含约 200 万个文件。我需要对这些文件进行一些处理(主要是删除其中 99%)。我预计由于数据大小会出现一些问题。特别是，我想知道 P
Python os.listdir() 不断跳过某些文件？
我编写了一个 Python 脚本，用于将给定目录中的所有文件名写到一个文件中进行处理，它在我的机器上运行良好。但是当我尝试在目标机器上运行它时，它会跳过一些文件。这是我正在使用的代码的 shell :
python - os.listdir 使用来自数组的输入
我正在尝试从文件中读取一行并将内容用作 os.listdir 方法的参数 f = open('test.txt', "r+") test = f.readlines() contentlist = [
Python - os.listdir 的顺序
这个问题在这里已经有了答案: Non-alphanumeric list order from os.listdir() (14 个答案) 关闭 4 年前。我是 Python 的新手，我正在编写一
python - os.listdir 中的文件名顺序
假设文件夹A包含以下文件: 0.jpg 1.jpg 2.jpg . . . n.jpg . . . 现在，python 脚本查看文件夹 A 并使用 for path, dirs, files in o
python - os.listdir 返回带有神秘字符的列表
我在目录上执行 os.listdir()，它返回如下列表: [u'Somefile.gif', u'SomeDirectory', u'SomeJPEG.jpeg'] 你的目的是什么？在我的搜索中，我
python os.listdir() 不显示桌面上的所有文件
我正在运行 Windows 7 并使用空闲解释器。 os.listdir() 没有显示我桌面上的所有文件。这是我从空闲状态运行命令时得到的输出: >>> os.listdir('C:\\Use
python - os.listdir 未读取所有文件
我试图从文件夹内的每个文件中提取特定行。我编写的代码是打开每个文件并打开新的输出文件，尽管它在每个文件中循环并在某些情况下输出数据两次。我有 15 个文件，所有文件之间大约有 800,000 行。 `
python - os.listdir 看不到我的目录
我正在编写一个 python 脚本，该脚本在 Windows 8.1 机器上安装 802.1x 证书。此脚本在 Windows 8 和 Windows XP 上运行良好(尚未在其他机器上尝试过)。我
python - 如何在网络路径上正确使用 os.listdir？
以下代码: def tema_get_file(): logdir='T:\\' logfiles = sorted([ f for f in os.listdir(logdir) i
python os.listdir 不显示所有文件
在我的 windows7 64 位系统中，c:/windows/system32 文件夹中有一个名为 msconfig.exe 的文件。是的，它必须存在。但是当我使用os.listdir 搜索文件夹

首页

博学

6Ren·AI

商城

python - 为什么 os.scandir() 和 os.listdir() 一样慢？