gpt4 book ai didi

python - 从谷歌搜索中提取结果数

转载 作者:行者123 更新时间:2023-12-01 01:28:01 24 4
gpt4 key购买 nike

我正在编写一个网络抓取工具,以提取出现在搜索结果页面左上角的谷歌搜索中的搜索结果数量。我写了下面的代码,但我不明白为什么phrase_extract 是 None 。我想提取短语“大约 12,010,000,000 个结果”。我在哪一部分犯了错误?可能错误地解析了 HTML?

import requests
from bs4 import BeautifulSoup

def pyGoogleSearch(word):
address='http://www.google.com/#q='
newword=address+word
#webbrowser.open(newword)
page=requests.get(newword)
soup = BeautifulSoup(page.content, 'html.parser')
phrase_extract=soup.find(id="resultStats")
print(phrase_extract)

pyGoogleSearch('world')

example

最佳答案

您实际上使用了错误的网址来查询谷歌的搜索引擎。您应该使用 http://www.google.com/search?q=<query> .

所以它看起来像这样:

def pyGoogleSearch(word):
address = 'http://www.google.com/search?q='
newword = address + word
page = requests.get(newword)
soup = BeautifulSoup(page.content, 'html.parser')
phrase_extract = soup.find(id="resultStats")
print(phrase_extract)

您可能只需要该元素的文本,而不是元素本身,因此您可以执行类似的操作

phrase_text = phrase_extract.text

或者获取整数的实际值:

val = int(phrase_extract.text.split(' ')[1].replace(',',''))

关于python - 从谷歌搜索中提取结果数,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/53177265/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com