gpt4 book ai didi

python - 使用 Selenium 抓取 Java 驱动的网站,废话

转载 作者:太空宇宙 更新时间:2023-11-03 21:18:47 32 4
gpt4 key购买 nike

我对 Python 还很陌生

我正在尝试从其网站获取打印机计数器值。该网站是用 Javascript 编写的,我无法从中获取任何内容。

网站元素如下所示,我需要突出显示元素上的值。

inspect elements

我尝试过使用selenium、requests、webdriver、beautifulsoup。

尝试了所有 webdriver.find 方法等。

我的最新代码如下所示,我尝试了很多其他东西,但一无所获。

from bs4 import BeautifulSoup
import requests
from selenium import webdriver


#url = requests.get('http://url')
#soup = BeautifulSoup(url.text, 'lxml')


driver = webdriver.Chrome('C:/Chrome/Driver/Path')
url = 'http://url'
get = driver.get(url)

html = driver.execute_script("return document.documentElement.outerHTML")

print(html)

我无法从网页中抓取任何内容,无法使用 Xpath、类、ID 或其他内容访问文本框。

我可以成功从除此打印机之外的其他网站获取元素。

感谢帮助

最佳答案

查看图像中的元素面包屑,您的内容似乎位于框架内。 Selenium 将每个帧视为一个单独的文档。您需要先切换到框架中,然后才能对其内容进行操作。

 driver.switch_to.frame(0)

如果是第一帧,上面应该可以工作。然后 driver.page_source 和您的定位器应该开始工作。

我更详细地解释了这一点 in this answer

关于python - 使用 Selenium 抓取 Java 驱动的网站,废话,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/54479294/

32 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com