gpt4 book ai didi

python - 在 Python 中获取页面的所有请求 url

转载 作者:行者123 更新时间:2023-12-05 07:49:31 25 4
gpt4 key购买 nike

有没有办法获取一个页面的所有请求的 url?例如,当我访问一个站点时,浏览器会向服务器发出多个网络请求,例如 html、css 和显示该页面所需的其他文件。我想使用 Python 获取所有这些 Assets url。基本上,我想从下面的屏幕截图中获取所有网址。谁能指出我正确的方向?

PS:我想通过脚本来自动执行此任务。我知道我可以使用无法自动化的 Wireshark 完成此类任务。

enter image description here

最佳答案

对于其他感兴趣的人:下一个片段,我从 a post from pythoncode 得到的,为我工作。

我确信它有一些如上所述的限制(不同的浏览器、不同的路径等,使得这个 hack 不通用),但它可能会节省一些人的时间。

# get the CSS files
css_files = []

for css in soup.find_all("link"):
if css.attrs.get("href"):
# if the link tag has the 'href' attribute
css_url = urljoin(url, css.attrs.get("href"))
css_files.append(css_url)
print(css_files) # list of URLs of the files called

关于python - 在 Python 中获取页面的所有请求 url,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/37264761/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com