gpt4 book ai didi

python - 正则表达式 : Remove Time-Stamp from File-Name

转载 作者:行者123 更新时间:2023-11-28 21:47:24 24 4
gpt4 key购买 nike

我正在阅读目录以查找特定文件名。我可以从每个文件名中删除文档标记 '.xml' 以进行比较。问题是其中大约 10% 的标题末尾有一个六位数的时间戳。

file_list = os.listdir(directory_address)

for entry in file_list:
re.sub('\.xml$','', entry).upper()


#file name examples

filename_1 = 'normal_filename'

filename_2= 'another_normal_filename_A23'

filename_3 = 'stamped_file_name_085373'

我的程序不会立即知道哪些文件有时间戳。一些文件——缺少时间戳——自然也会以一两个数字结尾。据我所知,只有标记文件名会以这种格式结尾 _######

我如何使用 regex 来识别恰好有六位数字附加到末尾 _###### 的文件名,并从字符串中删除这些数字以进行比较?

最佳答案

您可以使用 \d{6}$ 模式来匹配文件名末尾的 6 位数字,并使用 re.sub() 删除它们:

>>> import re
>>> filename = 'stamped_file_name_085373'
>>> filename = re.sub(r"_\d{6}$", "", filename)
>>> filename
'stamped_file_name'

关于python - 正则表达式 : Remove Time-Stamp from File-Name,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/36583329/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com