gpt4 book ai didi

python - python 中 href url 中的正则表达式编号

转载 作者:行者123 更新时间:2023-11-28 22:13:52 25 4
gpt4 key购买 nike

我正在尝试从这样的 URL 中提取数字: https://ghostbin.com/paste/dmjvt我想提取数字 3我设法用 beatifulsoup 从\li 提取到/li,我似乎无法设法做一个正则表达式从\a href 中提取这个单个数字,因为它后面可能有一些数字什么是 python 中的正则表达式来完成这个?谢谢

最佳答案

尝试使用这个正则表达式 /page/(\d+)/

import re
from bs4 import BeautifulSoup

html = '''<li class="page-item pagination-end">
<a class="page-link page-text" href="xxx/page/3/#filters">3</a>
</li>'''

soup = BeautifulSoup(html, 'html.parser')
endNav = soup.select_one('.page-item.pagination-end a')
navNumber = re.search(r'/page/(\d+)/', endNav['href']).group(1)
print(navNumber) # 3

关于python - python 中 href url 中的正则表达式编号,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/53682978/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com