gpt4 book ai didi

python - 使用带有隐藏登录页面的 Mechanize

转载 作者:行者123 更新时间:2023-12-04 16:21:43 28 4
gpt4 key购买 nike

我想写一个刮板来从 database of police reports 中提取 pdfs ,但我遇到了一个障碍。当我单击页面的“登录”按钮时,它不会显示单独的 URL,它只是异步加载登录页面。我不确定它是如何做到的 - 我在控制台中查看了 Net 选项卡,但该页面似乎没有发出任何 XHR 请求。

我打算用 Python 编写我的刮板,所以我想使用 mechanize 库来登录并浏览 pdf。但在我能做任何这些之前,我必须找到那个讨厌的登录页面!

最佳答案

如果网页正在执行大量 Ajax 类型的事件,那么您真的不能只使用 HTML 解析器——您还需要一个 Javascript 解释器。

你可能会被迫使用类似 Selenium 的东西或 PhantomJS .

关于python - 使用带有隐藏登录页面的 Mechanize ,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/29158729/

28 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com