gpt4 book ai didi

python - Beautifulsoup 在没有 findAll 的情况下按属性导航 div

转载 作者:太空狗 更新时间:2023-10-30 03:06:19 25 4
gpt4 key购买 nike

如何通过调用汤的属性找到特定的div?即类似 soup.html.body.div 的内容,但是我看不到如何在此处使用 id='idname' 获取特定的 div?

我可以执行 soup.findAll(id='idname')[0] 来获取特定标签,但据我所知,这是在搜索整个汤。

我想通过汤上的属性获取 div 会更快,因为您没有使用 findAll()

Firebug 将位置报告为 html.body.div[2].form.table[2].tbody.tr[3]... 但是执行 soup.html。 body.div[2] 给出一个关键错误。

更新:

假设您想从 http://www.google.com 中获取 I'm feeling lucky 按钮, firebug 报告为:

/html/body/center/span/center/div[2]/form/div[2]/div[3]/center/input[2]

有没有办法使用findAll达到这个目的?

最佳答案

您从 Firebug 获得的路径是一个 XPath 表达式。最好使用可让您直接使用 xpath 的解析器。我喜欢使用 lxml 及其 etree 接口(interface):

from lxml import etree
tree = etree.parse(yourfile)
lucky = tree.xpath('/html/body/center/span/center/div[2]/form/div[2]/div[3]/center/input[2]')

关于python - Beautifulsoup 在没有 findAll 的情况下按属性导航 div,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/8852760/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com