gpt4 book ai didi

python 通过获取 url 动态方式进行抓取

转载 作者:太空宇宙 更新时间:2023-11-04 01:40:20 25 4
gpt4 key购买 nike

我是数据抓取领域的新手,之前使用 Python 开发 Web 和桌面应用程序。我只是想知道,是否有任何方法可以从页面获取 url,然后查看它以获取特定信息,例如电话号码、地址等。

目前我正在使用 BeautifulSoup 和构建方法,我将 url 作为方法的参数。

我抓取的网站很大,很难为每个页面传递特定的 url。

有什么建议可以让它更快并 self 驱动吗?

提前致谢。

最佳答案

您可以使用 Scrapy .它简化了抓取和解析(默认使用 libxml2 进行解析)。

关于python 通过获取 url 动态方式进行抓取,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/5754922/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com