gpt4 book ai didi

Python 从多个页面请求 .get()?

转载 作者:太空宇宙 更新时间:2023-11-04 07:06:21 32 4
gpt4 key购买 nike

我正在学习如何使用 python 进行网络抓取,我想知道是否可以使用 requests.get() 抓取两个页面,这样我就不必进行两次单独的调用和变量。例如:

r1 = requests.get("page1")
r2 = requests.get("page2")

pg1 = BeautifulSoup(r1.content, "html.parser")
pg2 = BeautifulSoup(r2.content, "html.parser")

如您所见,有重复的代码。有办法解决这个问题吗?谢谢!

最佳答案

我喜欢一次获取多个 URL 的 grequests 库,而不是 requests。特别是在处理大量 URL 或具有许多子页面的单个 URL 时。

import grequests  
urls = ['http://google.com', 'http://yahoo.com', 'http://bing.com']
unsent_request = (grequests.get(url) for url in urls)

results = grequests.map(unsent_request)

在此之后,可以根据需要处理results。这适用于 JSON 数据:results[0] = 第一个 URL 数据,results[1] = 第二个 URL 数据,等等。

更多可以找到here

关于Python 从多个页面请求 .get()?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/44344077/

32 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com