gpt4 book ai didi

python - 如何扫描网页并获取图像和 YouTube 嵌入?

转载 作者:行者123 更新时间:2023-11-28 20:54:47 26 4
gpt4 key购买 nike

我正在构建一个网络应用程序,我需要在其中获取给定 URL 上嵌入的所有图像和任何 Flash 视频(例如 youtube)。我正在使用 Python。

我已经用谷歌搜索了,但没有找到任何关于此的有用信息(可能是因为我不知道这叫做搜索什么),有没有人对此有任何经验并且知道如何完成?

如果有可用的代码示例,我很乐意查看。

谢谢!

最佳答案

BeautifulSoup是一个很棒的屏幕抓取库。使用 urllib2 来获取页面,并使用 BeautifulSoup 来解析它。这是他们文档中的代码示例:

import urllib2
from BeautifulSoup import BeautifulSoup

page = urllib2.urlopen("http://www.icc-ccs.org/prc/piracyreport.php")
soup = BeautifulSoup(page)
for incident in soup('td', width="90%"):
where, linebreak, what = incident.contents[:3]
print where.strip()
print what.strip()
print

关于python - 如何扫描网页并获取图像和 YouTube 嵌入?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/271855/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com