gpt4 book ai didi

python - 无法抓取 Google Adsense

转载 作者:行者123 更新时间:2023-11-28 22:42:47 25 4
gpt4 key购买 nike

我正在尝试抓取网站并希望从 Google AdSense 获取网址和图片。但似乎我没有获得 Google Adsense 的任何详细信息。

这里我要
如果我们在谷歌中搜索“冰箱”,那么我们会在那里看到一些我需要获取的广告。或者一些博客、网站显示谷歌广告,如查看图片

enter image description here

enter image description here

但是当我检查时,我可以找到相关的 div 和 url,但是当我点击 url 时,我只得到静态 html 数据。

这是我需要获取的代码

Screenshot from google search

这是我用 Selenium、Python 编写的脚本。

from contextlib import closing
from selenium.webdriver import Firefox # pip install selenium
import time
from selenium.common.exceptions import TimeoutException
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC

url = "http://www.compiletimeerror.com/"

# use firefox to get page with javascript generated content
with closing(Firefox()) as browser:
browser.get(url) # load page
delay = 10 # seconds
try:
WebDriverWait(browser, delay).until(EC.presence_of_element_located(browser.find_element_by_xpath("(//div[@class='pla-unit'])[0]")))
print "Page is ready!"
Element=browser.find_element(By.ID,value="google_image_div")
print Element
print Element.text
except TimeoutException:
print "Loading took too much time!"

但我仍然无法获取数据。请给我任何引用或提示。

最佳答案

您需要先选择包含您要使用的元素的框架。

select_frame("id=google_ads_frame1");

注意:我不确定 python 语法。不过应该和这个差不多吧。

关于python - 无法抓取 Google Adsense,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/31434363/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com