gpt4 book ai didi

python - 如何使用scrapy抓取需要登录的网站?

转载 作者:行者123 更新时间:2023-12-01 08:31:51 24 4
gpt4 key购买 nike

我想从一个网站抓取数据,该网站需要登录才能到达某个页面才能抓取数据。

有没有办法使用Scrapy登录后抓取数据?或者我们是否可以模拟登录?

注意:我确实有登录凭据。

最佳答案

简短回答:是的,您可以在登录后抓取数据。检查scrapy中的Formdata和这个答案post request using scrapydocumentation

长答案:登录页面只是表单。您可以访问这些字段来填写所需的详细信息并发布该数据。您可以手动登录并检查 Chrome 开发者工具[ctrl + shift + i]是否有按下提交/登录按钮时进行的网络调用。然后,您可以检查发出的发布请求并将其复制到您的抓取工具中。您可以检查上面的链接以了解如何发布数据,以及请求和响应如何在 scrapy 中工作。

关于python - 如何使用scrapy抓取需要登录的网站?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/53886372/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com