gpt4 book ai didi

python - 在 Python 中使用正则表达式删除数字而不是年份

转载 作者:太空宇宙 更新时间:2023-11-04 00:57:58 24 4
gpt4 key购买 nike

我知道how to delete extra-word numbers in Python , 与:

s = re.sub("^\d+\s|\s\d+\s|\s\d+$", "", s)

我想知道是否可以在保持日期的同时执行相同的操作:

s = "我想删除像 84 这样的数字,但不想删除像 2015 这样的日期"

在英语中,一个快速而肮脏的规则可能是:如果数字以 18、19 或 20 开头且长度为 4,则不要删除。

最佳答案

要匹配除以18/19/20开头的4位数字序列以外的任何数字序列,您可以使用

r'\b(?!(?:18|19|20)\d{2}\b)\d+\b'

参见 regex demo

正则表达式匹配:

  • \b - 前导词边界
  • (?!(?:18|19|20)\d{2}\b) - 将后续模式 \d+ 限制为仅当没有 181920 开头且紧跟两位数 \d{2} 时匹配(请注意,您可以将先行缩短为 (?!(?:1[89]|20)\d{2}\b) 但很多人们通常对此表示不满,因为可读性受到影响)
  • \d+ - 一位或多位数字
  • \b - 尾随单词边界

Python code :

p = re.compile(r'\b(?!(?:18|19|20)\d{2}\b)\d+\b')
test_str = "Stack Overflow is a privately held website, the flagship site of the Stack Exchange Network, 4 5 6 created in 2008"
print p.sub("", test_str)

关于python - 在 Python 中使用正则表达式删除数字而不是年份,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/34199924/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com