gpt4 book ai didi

python - 用于匹配第三、第四、第五...单词的正则表达式

转载 作者:太空宇宙 更新时间:2023-11-03 17:17:53 25 4
gpt4 key购买 nike

我有一些字符串,例如“aaa bbb ccc”“aaa bbb ccc ddd”,“aaa bbb ccc ddd eee”。 ...

我需要一个正则表达式,这样我就无法摆脱 aaa bbb 并获得其他所有内容。

我正在尝试 '\w+\s\w+\s(\w+|\s)+' 但它不起作用。

In [171]: r = re.search('\w+\s\w+\s(\w+|\s)+', 'aaa bbb ccc ddd')

In [172]: r.group(0)
Out[172]: 'aaa bbb ccc ddd'

In [173]: r.group(1)
Out[173]: 'ddd'

我希望它返回ccc ddd

最佳答案

您的方法不起作用,因为重复捕获组会替换以前的捕获。如果您将其设为非捕获组(包括量词)并在其周围包裹一个捕获组,那么它应该可以工作。

re.compile(r"""
(?:\w+\s){2} # two words we don't care about
( # begin capturing
(?:\w+\s?)+ # 1+ word chars followed by an optional space, 1+ times
) # stop capturing""", re.X)

虽然我不确定你为什么要使用正则表达式。 str.split 不是更好吗?

s = 'aaa bbb ccc ddd'
result = s.split()[2:]

关于python - 用于匹配第三、第四、第五...单词的正则表达式,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/33468819/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com