gpt4 book ai didi

python - 如何使用 google api 抓取数据

转载 作者:行者123 更新时间:2023-11-28 19:14:56 25 4
gpt4 key购买 nike

import requests

def search(query, pages=4, rsz=8):
url = 'https://ajax.googleapis.com/ajax/services/search/web'
params = {
'v': 1.0, # Version
'q': query, # Query string
'rsz': rsz, # Result set size - max 8
}

for s in range(0, pages*rsz+1, rsz):
params['start'] = s
r = requests.get(url, params=params)
for result in r.json()['responseData']['results']:
yield result

在最初的 2,3 次尝试中,它正在检索所有需要的页面,但在 2,3 次尝试之后,它没有得到任何结果。它返回“无”或 []。尝试几次后,谷歌会阻止我的 IP 吗?有什么解决办法吗?

最佳答案

我不确定这是否有效,但避免被不鼓励抓取的网站阻止的唯一方法是在检索网页时使用代理。请检查如何在您的代码中使用代理。

关于python - 如何使用 google api 抓取数据,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/34663434/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com