gpt4 book ai didi

python - 抓取滚动时加载内容的动态网站

转载 作者:行者123 更新时间:2023-12-01 06:39:26 26 4
gpt4 key购买 nike

我不知道正确的术语,但我认为“动态网站”可能会解决问题。
我的意思是,当我滚动时,资源就会被加载。我搜索了解决方案,并遇到了网络驱动程序,我个人不喜欢加载整个浏览器,只是为了向下滚动。
另一种方法是查看网络选项卡并抓取我在那里找到的网址。

https://www.immowelt.de/liste/hamburg/wohnungen/mieten?prima=700&sort=relevanz&cp=1

然而,当我滚动时,内容确实被加载了。

当我打开网络选项卡并向下滚动时显示的链接:https://www.immowelt.de/liste/getlistitems

我是网络开发新手,所以我不明白我在网络选项卡中看到的这些链接如何命名完全相同但具有不同的值。

最佳答案

如果您仔细观察网络数据包。您将看到这是一个 POST 请求,并将表单数据发送到该链接。更仔细地查看表单数据:

query: geoid=108020&etype=1&esr=2&prima=700&sort=relevanz&cp=1
offset: 12
pageSize: 4

您会看到它发送了一个偏移量。这就是分页下一个结果。

关于python - 抓取滚动时加载内容的动态网站,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/59521454/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com