gpt4 book ai didi

python - 使用 Python/Django 从 html 获取第一张图片

转载 作者:搜寻专家 更新时间:2023-10-31 22:04:06 26 4
gpt4 key购买 nike

我正在从服务中抓取一堆 html 并稍微解析它。我正在寻找一种从第一个图像标签获取链接的方法。

类似这样的 JQuery 代码:

var imagelink = $('img:first', feed.content).attr('src');

但当然只使用 Python/Django(服务器在 Google 应用引擎上运行)。我宁愿不使用任何其他库,只是为了获取一个简单的链接。

最佳答案

您可以使用 BeautifulSoup 来执行此操作:

http://www.crummy.com/software/BeautifulSoup/

它是一个 XML/HTML 解析器。所以你传入原始 html,然后你可以在其中搜索特定的标签/属性等。

像这样的东西应该可以工作:

tree = BeautifulSoup(raw_html)
img_link = (tree.find('img')[0]).attr['src']

关于python - 使用 Python/Django 从 html 获取第一张图片,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/6194875/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com