gpt4 book ai didi

python - 使用 BeautifulSoup 抓取网站时读取页码

转载 作者:太空宇宙 更新时间:2023-11-03 21:43:17 24 4
gpt4 key购买 nike

我正在尝试仅读取 URL 链接中的页码并将其放入变量中。这是我从网站上抓取的。下面是我从网站上抓取的变量的打印输出

<li><a href="https://bp.portwallet.com/report/topUp?source=gp_web&amp;allSearch=&amp;amountFrom=1&amp;amountTo=50000&amp;startdate=2018-10-03&amp;enddate=2018-10-03&amp;topUpSearch=topUpSearch&amp;status=1&amp;rType=Prepaid&amp;per_page=46">Last ›</a></li>

我需要将 per_page= 值放入变量中..

我试图只抓取数字,但没有成功

最佳答案

from bs4 import BeautifulSoup
page = '''<li><a href="https://bp.portwallet.com/report/topUp?source=gp_web&amp;allSearch=&amp;amountFrom=1&amp;amountTo=50000&amp;startdate=2018-10-03&amp;enddate=2018-10-03&amp;topUpSearch=topUpSearch&amp;status=1&amp;rType=Prepaid&amp;per_page=46">Last ›</a></li>'''
soup = BeautifulSoup(page, 'html.parser')
x = soup.select('a')
per_page = (x[0]['href']).split('per_page=')[-1]
print('per_page:', per_page)

输出:

per_page: 46

关于python - 使用 BeautifulSoup 抓取网站时读取页码,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/52685458/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com