gpt4 book ai didi

python - 在 Python 中提取文件名的后缀

转载 作者:行者123 更新时间:2023-11-28 16:56:37 25 4
gpt4 key购买 nike

我正在使用 Python 从文件名列表创建 HTML 链接。文件名的格式如下:song1_lead.pdf、song1_lyrics.pdf。他们也可以有像 song2_with_extra_underscores_vocals.pdf 这样的名字。但共同点是它们都将以 _someText.pdf 结尾

我的目标是只提取最后一个下划线之后的 someText 部分,并且不带 .pdf 扩展名。所以 song1_lyrics.pdf 结果只有:歌词

我有以下 Python 代码来实现我的目标,但似乎我正在以艰难的方式做到这一点。有没有更有效的方法来做到这一点?

testString = 'file1_with_extra_underscores_lead.pdf'

#Step 1: Separate string using last occurrence of under_score
HTMLtext = testString.rpartition('_')
# Result: ('file1_with_extra_underscores', '_', 'lyrics.pdf')

#Step 2: Separate the suffix and .pdf extension.
HTMLtext = HTMLtext[2].rpartition('.')
#Result: ('lead', '.', 'pdf')

#Step 3: Use the first item as the end result.
HTMLtext = HTMLtext[0] #Result: lead

我认为我正在尝试做的事情可以用更少的代码行来实现,而且不必像我现在所做的那样多次设置 HTMLtext。

最佳答案

您可以使用 pathlib 中的路径提取最终路径组件,不带后缀:

from path import Path
Path('file1_with_extra_underscores_lead.pdf').stem.split('_')[-1]

输出:

'lead'

关于python - 在 Python 中提取文件名的后缀,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/57747841/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com