gpt4 book ai didi

web-scraping - 如何使用 Import.io 抓取多个页面

转载 作者:行者123 更新时间:2023-12-04 20:38:03 26 4
gpt4 key购买 nike

我正在尝试从站点中获取事件列表 http://www.cityoflondon.gov.uk/events/ , 但是当用 import.io 抓取它时,我只能提取第一页。

如何一次提取所有页面?

最佳答案

您可以使用此站点提取数据,使用爬虫或批量提取。上面的网站使用了一种非常简单的分页形式:

http://www.cityoflondon.gov.uk/events/Pages/default.aspx    
http://www.cityoflondon.gov.uk/events/Pages/default.aspx?start1=13
http://www.cityoflondon.gov.uk/events/Pages/default.aspx?start1=49
http://www.cityoflondon.gov.uk/events/Pages/default.aspx?start1=25
http://www.cityoflondon.gov.uk/events/Pages/default.aspx?start1=37

这是我为上述 URL 创建的数据集,其中应包含所有相关信息。

319aebad-88ea-4053-a649-2087011ce041

如果您对某个网站有更多疑问,请联系 support@import.io

谢谢!
梅格

关于web-scraping - 如何使用 Import.io 抓取多个页面,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/31717541/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com