python - 更实用的os.walk-6ren

python - 更实用的os.walk

转载作者：太空宇宙更新时间：2023-11-03 19:25:23

25

4

由于我需要对目录进行多次遍历，其中需要进行一些复杂的过滤，因此我想围绕 os.walk 创建一个包装器。

这是这样的:

def fwalk(root, pred_dir, pred_files, walk_function=walk):
    """Wrapper function around the standard os.walk, that filter out
    the directories visited using a filtering predicate
    """

    for base, dirs, files in walk_function(root):
        # ignore also the root directory when not needed, which is
        # actually more important than the subdirectories
        dirs = [d for d in dirs if pred_dir(path.join(base, d))]
        files = [f for f in files if pred_files(path.join(base, f))]

        if _ignore_dirs_predicate(base) and (dirs or files):
            yield base, dirs, files

基本上它的行为与 os.walk 一样，但需要两个谓词来使其更好地组合在更高级别的函数中。例如，这只会通过 python 模块:

ISA_PY = lambda f: f[-3:] == '.py'
# I can make it a class or maybe even a module if it's better
def walk_py(src):
    # should not be in the list
    return fwalk(src, _ignore_dirs_predicate, ISA_PY)

它还需要一个步行函数，例如可以只是一个虚拟步行，用于测试。

def dummy_walk(_):
    test_dir = [
        ('/root/', ['d1, .git'], []),
        ('/root/d1', [], ['setup.py']),
        ('/root/test', [], ['test1.py']),
        ('/root/.git', [], [])
    ]

    # returns a function which  skips the parameter and return the iterator
    return iter(test_dir)

现在的问题是，我发现很难相信这个函数，除了使用虚拟行走的一些单元测试很难确保它是正确的。

关于如何改进它并使其变得更好有什么建议吗？

最佳答案

您需要就地修改目录，以避免递归遍历已删除的目录。使用:

dirs[:] = [d for d in dirs if pred_dir(path.join(base, d))]

这将消除检查 _ignore_dirs_predicate(base) 的需要(并消除由于使用 _ignore_dirs_predicate 而不是 导致的 NameError >pred_dir)

您还应该重写ISA_PY以使用str.endswith()

关于python - 更实用的os.walk，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/8324840/

25

4

0

文章推荐： c# - ASP.NET : SqlDataSource insert - identity parameter

文章推荐： c# - 四舍五入到最近的年份

文章推荐： c# - 线程正在退出

python - 自己编写的 os.walk-alike 比 os.walk 本身慢得多 - 为什么？
不幸的是，这段代码比“os.walk”运行得慢，但为什么呢？会不会是“for”循环导致运行缓慢？ “像‘os.walk’一样工作的代码:(“os.walk”函数做它做的事) 注意:我写作是为了提升自
python - 更实用的os.walk
已关闭。这个问题是 off-topic 。目前不接受答案。想要改进这个问题吗？ Update the question所以它是on-topic用于堆栈溢出。已关闭11 年前。 Improve th
java - 在有限区域的中心位置周围随机出现 "walk"？
我不确定我是否能正确表达这个问题，但就是这样...... 我想编写一个示例，其中小点具有它们移动所依据的速度 - 而且，还有一个随机运动叠加到“正确”运动上。使用下面的 Processing 代码，我
go - 为什么我需要用新的子例程运行 Walk？
我正在写 Walk function in the go tutorial基本上按顺序遍历树。我的作品: package main import ( "fmt" "code.googl
AngularJS 和谷歌云端点 : walk through needed
我是 AngularJS 的新手，但我真的很喜欢 AngularJS 的工作方式，所以我想将它部署为我的 Google 云端点后端的客户端。然后我立即遇到两个问题: 1、放在哪里myCallback
python - os.walk 目录名中的空列表是什么？
使用 python 3.5 时 os.walk()并查看 dirname 输出，我得到了很多空列表(返回 [ ] )。我不知道为什么。 import os tdir = '/home/pontiac/
java - Files.walk 识别文件是来自子文件夹还是主文件夹
我终于让我的 Files.walk 开始工作了，我的问题是是否有任何方法可以识别收集到列表中的文件是否来自子文件夹或主文件夹，因为这些文件有删除功能，但来自子文件夹的文件用户不应删除文件夹。 pri
Python:os.walk 中的当前目录
我需要在 os.walk 进程中获取当前目录。当只有一个子目录级别时它可以工作，但当有更多子目录级别时它会失败。请指教... [代码] # AFFECTS everything reachable f
java - 多线程中的 SNMP Walk
当我 snmpWalk 一个 ip 时，需要 5 秒。但如果我在 for 循环中发送 snmpWalk 请求，步行时间就会增加。以多线程方式使用 snmp 或仅使用 ExecutorService 是
python - Os.walk - 计算父目录的同一子目录中的文件数
我正在尝试计算大量父目录中特定文件夹中的文件数量。每个项目都包含相同的文件夹结构: C:/Projects 2019 Project A Communi
Python os.walk，保存状态的方法？
我需要迭代文件服务器上的所有文件，并且我希望能够停止该进程并稍后在文件树中的任何位置恢复它。这可以用 os.walk 来完成，还是需要从头开始实现？编辑:理想情况下，我希望解决方案是持久的，以便脚本
python - os.walk() 结果类型
我有一个包含数千个文件的文件夹。我需要将每个文件的文件名与另一个数组中的列进行匹配。 import os filenames = [] for files in os.walk("Directory"
python - 使用Python中的os.walk()模块从子文件夹中提取行？
我想打开一个文件夹中的一系列子文件夹，找到一些文本文件并打印文本文件的一些行。我正在使用这个: from glob import glob import fileinput with open('ou
Python os.walk() 方法
我是 stackoverflow 的新手。在编写以下代码时，我从该论坛获得了很多帮助。下面的代码搜索系统驱动器上的所有目录/子目录，但在查找“D”驱动器时，它只查找我运行该程序的文件夹后面的那些目录和
python - os.walk 给出不存在的目录
我有一个文件夹，其中有对应10个不同类的子文件夹，这些子文件夹的名称就是我的标签。我想出了以下代码将图像读入 Numpy 数组并保存标签。 import numpy as np import pand
Python，os.walk()，传递信息备份？
我目前正在尝试编写一个简单的Python程序，该程序循环遍历一堆子目录，查找java文件并打印一些有关某些关键字使用次数的信息。我已经设法让这个在大部分情况下工作。我遇到的问题是打印有关更高目录的总体
python - os.walk 带通配符的路径
我想遍历一个目录并搜索给定的文件。这是我编写的一些代码: import os def find(filename, path): for root, dirs, files in os.walk(
c - "Walking"C 中的缓冲区
我不确定这种方法在 C 中是否正确(详细为 Atmel xmega 的 avrgcc)。数据是 ASCII 字符串。 #define BUFFER_SIZE 64 char dataBuffer[2
c# - VR 添加运动 : Walk
使用 Unity2017.3.1f1 Personal(64 位)为 Android 构建 VR 应用程序，使用 Cardboard VR SDK。该应用的目的是让用户以身临其境的方式可视化数据。目
java - Walking Tree - 标签值的长度
这是我要解决的问题。我有一个简单的 HTML 页面: Hello World

首页

博学

6Ren·AI

商城

python - 更实用的os.walk