gpt4 book ai didi

Javascript 代码未使用 python 代码提取

转载 作者:太空宇宙 更新时间:2023-11-03 20:58:05 25 4
gpt4 key购买 nike

我正在尝试从网站提取 .mp4 链接,该链接仅显示在网络浏览器的“检查元素”选项卡中。

我在互联网上读到我需要使用 selenium 和 PhantomJS 来获取该代码。我尝试过,但我得到了 HTML 文件,该文件在“显示源代码”中可见

from selenium import webdriver

driver = webdriver.PhantomJS(executable_path=r'C:\Users\Nevendary\Desktop\phantomjs-2.1.1-windows\bin\phantomjs')
driver.get("https://filmovitica.com/pucanj-u-sljiviku-preko-reke-1978-domaci-film-gledaj-online/")
driver.implicitly_wait(30)

print(driver.page_source)

我希望获得包含以下内容的代码:https://fs40.gounlimited.to/tea5u5akd32qzxfffpqyfndb6resauu5w43w7enoxkvu6sjtrf5hfhbz3ika/v.mp4

但我只得到网站的正常 HTML

最佳答案

您可以直接获取视频元素的 src 属性,而不是搜索页面源,其中包含您要查找的链接。

视频链接位于 iframe 中。获取页面源而不切换到框架将不会返回视频链接。

我使用 chromedriver 作为示例。

试试这个:

from selenium import webdriver
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC
from selenium.webdriver.common.by import By

driver = webdriver.Chrome(executable_path="chromedriver.exe")

wait = WebDriverWait(driver, 20)
driver.get("https://filmovitica.com/pucanj-u-sljiviku-preko-reke-1978-domaci-film-gledaj-online/")

vframe = driver.find_element_by_xpath("//iframe[@width='900']")

driver.switch_to.frame(vframe)

videoElement = wait.until(EC.visibility_of(driver.find_element(By.CSS_SELECTOR, "#vplayer > div > div.container > video")))

print(videoElement.get_attribute('src'))

driver.quit()


关于Javascript 代码未使用 python 代码提取,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/55882471/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com