gpt4 book ai didi

python - 抓取页面时找不到视频网址

转载 作者:太空宇宙 更新时间:2023-11-03 16:49:32 25 4
gpt4 key购买 nike

我想从以下页面下载视频:

https://www.indiegogo.com/projects/protest-the-hero-new-album--3#/

使用Firebug,我可以看到视频的url,

<video src="https://09-lvl3-pdl.vimeocdn.com/01/1449/2/57246728/138634997.mp4?expires=1457996449&amp;token=089e435c20e7781d36fce" preload="metadata">
</video>

但是,我尝试使用Python对页面进行scape,这句话丢失了,我无法获取url。我也尝试过Selenium,但同样的问题仍然存在。如何使用我的抓取工具访问视频网址?

此外,视频网址似乎不起作用。我怎样才能获得可以下载视频的网址?

最佳答案

可以用 selenium 来解决.

诀窍是所需的video标签位于iframe - 您需要切换到它的上下文,然后搜索video 元素。然后,使用get_attribute()获取 src 属性值。完整的工作代码:

from selenium import webdriver
from selenium.webdriver.common.by import By
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC

browser = webdriver.Chrome() # or webdriver.Firefox(), or webdriver.PhantomJS() or etc.
wait = WebDriverWait(browser, 10)

browser.get('https://www.indiegogo.com/projects/protest-the-hero-new-album--3#/')

# waiting for the frame to become present
frame = wait.until(EC.presence_of_element_located((By.CSS_SELECTOR, "#vimeoPlayer")))
browser.switch_to.frame(frame)

# get video url
url = browser.find_element_by_tag_name("video").get_attribute("src")
print(url)

browser.close()

打印:

https://09-lvl3-pdl.vimeocdn.com/01/1449/2/57246728/138634997.mp4?expires=1457998452&token=0c54810bc365a94ea8486

关于python - 抓取页面时找不到视频网址,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/35998826/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com