gpt4 book ai didi

python - 用 Python 抓取文件名的一部分

转载 作者:太空宇宙 更新时间:2023-11-04 06:52:16 25 4
gpt4 key购买 nike

这里是新手。

我刚刚使用 Python/编码工作了几天,但我想创建一个脚本来抓取与特定模式对应的部分文件名,并将其输出到文本文件。

所以就我而言,假设我有四个这样的 .pdf:

aaa_ID_8423.pdf
bbbb_ID_8852.pdf
ccccc_ID_7413.pdf
dddddd_ID_4421.pdf

(Note that they are of variable length.)

我希望脚本遍历这些文件名,获取“ID_”之后和文件扩展名之前的字符串。

您能指出哪些 Python 模块和可能的指南可以帮助我吗?

最佳答案

这是一个使用 re 模块的简单解决方案,如其他答案中所述。

# Libraries
import re

# Example filenames. Use glob as described below to grab your pdf filenames
file_list = ['name_ID_123.pdf','name2_ID_456.pdf'] # glob.glob("*.pdf")

for fname in file_list:
res = re.findall("ID_(\d+).pdf", fname)
if not res: continue
print res[0] # You can append the result to a list

下面应该是您的输出。您应该能够使它适应其他模式。

# Output
123
456

祝你好运!

关于python - 用 Python 抓取文件名的一部分,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/30333186/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com