gpt4 book ai didi

python - 如何在正则表达式中应用条件

转载 作者:行者123 更新时间:2023-11-28 21:49:25 24 4
gpt4 key购买 nike

您好,我是一名新手,目前正在尝试通过试验各种模式来了解正则表达式模式。我试图为此网址创建正则表达式模式但失败了。是亚马逊的分页链接。

http://www.amazon.in/s/lp_6563520031_pg_2?rh=n%3A5866078031%2Cn%3A%215866079031%2Cn%3A6563520031&page=2s&ie=UTF8&qid=1446802571

或者

http://www.amazon.in/Tena-Wet-Wipe-Pulls-White/dp/B001O1G242/ref=sr_1_46?s=industrial&ie=UTF8&qid=1446802608&sr=1-46

我只想通过这两个东西来检查 url。

  1. If the url has dp directory or product directory

  2. If the url has query string page having any digit

我尝试创建正则表达式模式但失败了。 我希望如果第一件事不存在,则正则表达式模式应与第二件事匹配(反之亦然)

这是我制作的正则表达式模式:

.*\/(dp|product)\/ | .*page

这是我的 regex101 链接:https://regex101.com/r/zD2gP5/1#python

最佳答案

因为你只想检查一个字符串是否包含某种模式,你可以使用

\/(?:dp|product)\/|[&?]page=

参见 regex demo

在 Python 中,只需使用 re.search 进行检查:

import re
p = re.compile(r'/(?:dp|product)/|[&?]page=')
test_str = "http://w...content-available-to-author-only...n.in/s/lp_6563520031_pg_2?rh=n%3A5866078031%2Cn%3A%215866079031%2Cn%3A6563520031&page=2s&ie=UTF8&qid=14468025716"
if p.search(test_str):
print ("Found!")

此外,在 Python 正则表达式模式中,无需转义 / 斜杠。

正则表达式匹配两个替代子模式(\/(?:dp|product)\/[&?]page=):

  • / - 正斜杠
  • (?:dp|product) - dpproduct(不将捕获存储在捕获缓冲区中,因为它是 < em>非-捕获组)
  • / - 斜杠
  • | - 或者...
  • [&?] - &?(我们检查查询字符串参数的开头)
  • page= - 符号的文字序列 page=

关于python - 如何在正则表达式中应用条件,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/33564433/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com