gpt4 book ai didi

python - 递归比较两个目录并标记等效结构

转载 作者:太空宇宙 更新时间:2023-11-03 15:22:28 25 4
gpt4 key购买 nike

我已经在 stackoverflow 中阅读了很多与 python 比较目录相关的问题。但是,我当前的问题有点不同。
我有两个目录,里面包含两个不同版本的发布包内容。现在我想比较以确保内容相同。 但是很少有文件嵌入了版本名称。现在这是比较它们并得出结论的最佳方法(版本差异除外,所有文件都匹配)。


例如:
版本V1R1C1包含如下目录结构

pmt> find . -name "*"
.
./c1
./c1/c2
./c1/c1_V1R1C1.cfg
./a1
./a1/a1_V1R1C1.cfg
./a1/a2
./a1/a2/a1a2_V1R1C1.cfg
./b1/a_best_file.txt
./b1/b2/a_test_file.txt
./b1/b2/b1b2_V1R1C1.cfg
./a_V1R1C1.cfg

版本 V2R3C1 可能包含以下结构

pmt> find . -name "*"
.
./c1
./c1/c2
./c1/c1_V2R3C1.cfg
./a1
./a1/a1_V2R3C1.cfg
./a1/a2
./a1/a2/a1a2_V2R3C1.cfg
./b1/a_best_file.txt
./b1/b2/a_test_file.txt
./b1/b2/b1b2_V2R3C1.cfg
./a_V2R3C1.cfg

在上述情况下,程序必须将其标记为等效结构。

我能想到的解决方案很少——例如,将目录结构递归地读入缓存 (dict)、提取版本信息并进行比较等。但由于两个原因 1. 它确实看起来不是一个完全有效的机制不使用内置目录比较 2. 多次读取/撕裂/比较必然会产生成本(尤其是目录树结构巨大的情况下)。

我正在寻找比上述方法简单高效的想法。


附言:
1.如果有任何差异(除了与上面示例不同的版本),我想使用左/右等来获得差异列表。
2. 我们可以预先假设两个目录中的版本名称是哪个(如第一种情况下的 V1R1C1 和第二种情况下的 V2R3C1)。

最佳答案

使用集合比较怎么样?

set((remove_version(filepath) for filepath in iter_file(dic1))) == set((remove_version(filepath) for filepath in iter_file(dic2)))

关于python - 递归比较两个目录并标记等效结构,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/13036272/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com