gpt4 book ai didi

python - 正则表达式删除所有标点符号和括号括起来的任何内容

转载 作者:太空宇宙 更新时间:2023-11-04 11:00:21 25 4
gpt4 key购买 nike

我正在尝试从 python 中的字符串中删除所有标点符号以及方括号或圆括号内的任何内容。我的想法是在某种程度上标准化歌曲名称,以便在我查询 MusicBrainz WebService 时获得更好的结果。

示例输入:T.N.T. (直播)[纽约]

预期输出:T N T

我可以用两个正则表达式来完成,但我想看看是否可以只用一个正则表达式来完成。我尝试了以下方法,但没有用...

>>> re.sub(r'\[.*?\]|\(.*?\)|\W+', ' ', 'T.N.T. (live) [nyc]')
'T N T live nyc '

如果我将 \W+ 拆分成它自己的正则表达式并第二次运行它,我会得到预期的结果,所以看起来 \W+ 正在吃大括号和括号在前两个选项可以处理它们之前。

最佳答案

你是正确的,\W+ 正在吃大括号,移除 + 并且你应该被设置:

>>> re.sub(r'\[.*?\]|\(.*?\)|\W', ' ', 'T.N.T. (live) [nyc]')
'T N T '

关于python - 正则表达式删除所有标点符号和括号括起来的任何内容,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/6144326/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com