gpt4 book ai didi

python - HTML 标签之间的 Selenium

转载 作者:行者123 更新时间:2023-11-28 20:26:03 24 4
gpt4 key购买 nike

将由 Javascript 创建的页面中的所有 HTML 传递给 BeautifulSoup 的最佳方法是什么?

我目前正在使用:

from selenium import webdriver
from selenium.common.exceptions import NoSuchElementException
from selenium.webdriver.common.keys import Keys

from BeautifulSoup import BeautifulSoup

browser = webdriver.Firefox()
browser.get("http://www.yahoo.co.uk")
html = browser.find_elements_by_id("html")

但是“html”始终是一个空列表。我做错了什么?

最佳答案

从 Selenium 将页面源传递给 Beautiful Soup 的正确方法是:

from selenium import webdriver
from selenium.common.exceptions import NoSuchElementException
from selenium.webdriver.common.keys import Keys

from BeautifulSoup import BeautifulSoup

browser = webdriver.Firefox()
browser.get("http://www.yahoo.co.uk")
html_source = browser.page_source
html = BeautifulSoup(html_source)

这样,浏览器加载页面,提取完整的 html 源并将其传递给 BeautifulSoup。结果可以像任何其他 Beautiful Soup 对象一样进行解析。

关于python - HTML 标签之间的 Selenium ,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/12873030/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com