gpt4 book ai didi

Python:如何使用 "listfiles"的输出来删除/移动/等。文件

转载 作者:太空宇宙 更新时间:2023-11-04 06:41:50 25 4
gpt4 key购买 nike

背景:

我的目标是在两个不同的文件夹(没有子文件夹)中找到重复的文件。为此,我使用以下 Python 脚本:

###Check ob alle Archive noch vorhanden oder ob Daten bei Check gelöscht wurden
def listfiles(path):
files = []
for dirName, subdirList, fileList in os.walk(path):
dir = dirName.replace(path, '')
for fname in fileList:
if fname.endswith("_GIS.7z"):
files.append(os.path.join(dir, fname))
return files

x = listfiles(root)
y = listfiles(backupfolderGIS)

#q = [filename for filename in x if filename not in y]

files_only_in_x = set(x) - set(y)
files_only_in_y = set(y) - set(x)
files_only_in_either = set(x) ^ set(y)
files_in_both = set(x) & set(y)
all_files = set(x) | set(y)

print "Alle Datein:"
print all_files
print " "

print "Nur im Zwischenspeicher:"
print files_only_in_x
print " "

print "Nur im Backupordner:"
print files_only_in_y
print " "

print "Nur einem von beiden Ordnern:"
print files_only_in_either
print " "

print "In beiden Ordnern:"
print files_in_both
print " "

相关的输出变量/列表是files_in_both(文件夹);它向我展示了重复项;如果我使用 print,它看起来像 set(['NameoftheProject_GIS.7z', 'NameofanotherProject_GIS.7z'])

问题:

如何使用此输出/信息(目录中的重复文件)删除/移动它们?例如,文件夹 backupfolderGIS/列表 files_in_both 中的文件 NameoftheProject_GIS.7zNameofanotherProject_GIS.7z

最佳答案

os.walk 从您传递的根目录开始递归检查所有文件夹和子文件夹,您想检查两个不同的文件夹(没有子文件夹) 所以只需搜索每个文件夹使用glob,如果你想移动你可以使用shutil.move :

from glob import iglob
from os import path
from shutil import move

pt1, pt2 = "/path_1", "path_2"
dupe = set(map(path.basename, iglob("/path_1./*_GIS.7z"))).intersection(map(path.basename, iglob("/path_2./*_GIS.7z")))

for fle in dupe:
# move(src, dest)
move(path.join(pt1, fle), "wherever")

或删除使用 os.remove :

for fle in dupe:
os.remove(path.join(pt1, fle))

如果您想从 pt2 移动/删除文件,则将其传递给 path.join 代替 pt1。

您还可以将 str.endwithos.listdir 一起使用:

dupe = set(fname for fname in os.listdir(pt1) if fname.endswith("_GIS.7z")).intersection(fname for fname in os.listdir(pt2) if fname.endswith("_GIS.7z"))

为了避免重复你可以把它放在一个函数中:

from shutil import move
from os import path, listdir
def listfiles(path, end):
return set(fname for fname in listdir(path) if fname.endswith(end))

for fle in listfiles(pt1,"_GIS.7z").intersection(listfiles(pt2, "_GIS.7z")):
move(path.join(t1, fle), "wherever")

现在,如果您确实想检查所有文件夹中是否有具有相同基本名称的文件,以及是否存在重复名称,则需要记录完整路径,您可以使用 defaultdict 按基本名称对所有常见文件进行分组。 :

from os import path, walk
from collections import defaultdict

def listfiles(pth, end):
files = defaultdict(list)
for dirName, subdirList, fileList in walk(pth):
for fname in fileList:
if fname.endswith(end):
files[fname].append(path.join(dirName, fname))
return files

你会得到一个字典,其中键是基本名称,值是文件列表以及每个文件的完整路径,任何具有多个值的列表意味着你至少有两个具有相同名称的文件,但你应该记住具有相同的基本名称并不意味着文件实际上是相同的。

关于Python:如何使用 "listfiles"的输出来删除/移动/等。文件,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/37745523/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com