gpt4 book ai didi

Python Mechanize,如何获取URL参数

转载 作者:行者123 更新时间:2023-12-04 16:21:07 25 4
gpt4 key购买 nike

我目前正在研究网站抓取工具。因为我必须登录才能访问该网站,所以必须生成并保存 session ID 以供进一步使用。session ID 位于 URL 的末尾。

https://example.com/something.php?sid=123456789
我尝试使用 geturl() 命令,但它只返回没有任何参数的 URL。
获取 url 参数的最佳方法是什么?

最佳答案

from urllib.parse import urlparse

parsed = urlparse(url)
print(parsed)
输出:
ParseResult(scheme='https', netloc='example.com', path='/something.php', params='', query='sid=123456789', fragment='')
然后,您可以访问:
print(parsed.query)
输出:
sid=123456789
然后,您可以提取:
sid = parsed.query.split('sid=')[-1]
print(sid)
输出:
123456789

关于Python Mechanize,如何获取URL参数,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/62973929/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com