gpt4 book ai didi

python - 统计 Google 新闻搜索结果

转载 作者:行者123 更新时间:2023-12-01 08:27:39 29 4
gpt4 key购买 nike

我正在尝试以编程方式获取搜索字词列表的 Google 新闻搜索结果计数(即有多少个结果),但仅限于过去 1 年。使用用户界面搜索时,结果计数仅出现在常规搜索中,但在“工具 > 最近 > 过去一年”下时不会出现。我在 python 中尝试了下面的代码(首先返回谷歌新闻的搜索结果计数,没有“过去 1 年”过滤器,但它有一个问题 - 它报告了错误的结果计数。例如,转到谷歌新闻和搜索 Apple,会产生 3.21 亿条结果: https://www.google.com/search?q=apple&source=lnms&tbm=nws&sa=X&ved=0ahUKEwj81ojfheLfAhXE_SwKHRuNByUQ_AUIDygC&biw=1600&bih=696但下面的代码报告了 4.15 亿条结果。

那么我该如何做到这一点,并在以后限制去年结果的计数呢?当然,它不一定是用 python 编写的。

非常感谢。

Python 代码:

import requests
enter code here`from bs4 import BeautifulSoup
import argparse

parser = argparse.ArgumentParser(description='Get Google Count.')
parser.add_argument('word', help='word to count')
args = parser.parse_args()

r = requests.get('http://www.google.com/search',
params={"client":"firefox-b-ab",
"tbm":"nws",
"ei":"Oj02XIiCO6-V1fAP9d-j0AY",
'q':'"'+args.word+'"',
'oq':'"'+args.word+'"',
"tbs":"li:1"}

)

soup = BeautifulSoup(r.text,"html.parser")
print (soup.find('div',{'id':'resultStats'}).text)

Google 新闻计数不准确。

最佳答案

import requests
from bs4 import BeautifulSoup
import argparse

parser = argparse.ArgumentParser(description='Get Google Count.')
parser.add_argument('word', help='word to count')
args = parser.parse_args()

r = requests.get('http://www.google.com/search',
params={"client":"firefox-b-ab",
"tbm":"nws",
"ei":"Oj02XIiCO6-V1fAP9d-j0AY",
'q':'"'+args.word+'"',
'oq':'"'+args.word+'"',
"tbs":"li:1"}

)

soup = BeautifulSoup(r.text,"html.parser")
print len((soup.find('div',{'id':'resultStats'}).text))

关于python - 统计 Google 新闻搜索结果,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/54120781/

29 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com