gpt4 book ai didi

Python 正则表达式在输出中搜索和打印 'apostrophes' (')

转载 作者:行者123 更新时间:2023-12-04 07:37:33 28 4
gpt4 key购买 nike

有没有办法改进这个正则表达式来搜索所有以 t 结尾的词,包括 don't ?我还想打印整个单词,而不仅仅是最后一个 t .

r"\b\w*\Wt\b|\b\w*t\b"
我不得不写出 2 个单独的案例以结尾 t't .或者这可能是最好的?

最佳答案

我会用 \b\S*t\b .它解决了引擎必须扫描一个单词却无法找到非单词字符并尝试模式中的另一个分支的问题。至少,交换交替的两侧,因为常见的情况是这个词不会有收缩。

>>> import re
>>> s = "mitt cat bat don't foobar"
>>> re.findall(r"\b\S*t\b", s)
['mitt', 'cat', 'bat', "don't"]
目前尚不清楚您想如何处理非单词标点符号,但请考虑尝试处理此问题的变体:
>>> s = "mitt cat bat. don't foobar tee t e.t."
>>> re.findall(r"\b\S*t\b", s)
['mitt', 'cat', 'bat', "don't", 't', 'e.t']
>>> re.findall(r"\b[^.,!?\s]*t\b", s)
['mitt', 'cat', 'bat', "don't", 't', 't']
显然,如果缩写和边缘情况是您规范的一部分,则可能需要注意。

关于Python 正则表达式在输出中搜索和打印 'apostrophes' ('),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/67663179/

28 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com