gpt4 book ai didi

python - 在 Python 中使用 BeautifulSoup 获取直接父标签

转载 作者:技术小花猫 更新时间:2023-10-29 12:25:10 24 4
gpt4 key购买 nike

我已经研究过这个问题,但还没有看到解决这个问题的实际解决方案。我在 Python 中使用 BeautifulSoup,我想要做的是从一个页面获取所有图像标签,遍历每个标签并检查每个标签以查看它的直接父级是否是 anchor 标签。

这是一些伪代码:

html = BeautifulSoup(responseHtml)

for image in html.findAll('img'):
if (image.parent.name == 'a'):
image.hasParent = image.parent.link

对此有什么想法吗?

最佳答案

你需要检查parentname :

for img in soup.find_all('img'):
if img.parent.name == 'a':
print "Parent is a link"

演示:

>>> from bs4 import BeautifulSoup
>>>
>>> data = """
... <body>
... <a href="google.com"><img src="image.png"/></a>
... </body>
... """
>>> soup = BeautifulSoup(data)
>>> img = soup.img
>>>
>>> img.parent.name
a

您还可以使用 CSS selector 检索具有直接 a 父级的 img 标签:

soup.select('a > img')

关于python - 在 Python 中使用 BeautifulSoup 获取直接父标签,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/27874579/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com