gpt4 book ai didi

python - 我将如何使用 Beautiful Soup 提取此 HTML 元素属性的值?

转载 作者:太空宇宙 更新时间:2023-11-03 13:04:36 26 4
gpt4 key购买 nike

我正在开发一个抓取网页的小工具。我正在使用 Beautiful Soup .我想从页面中获取类 ID。 HTML 代码看起来像这样:

<span class='class_id' id='New_line'></span>

如何获取class_id

最佳答案

此答案引用了问题的旧版本,其中未提及 beautifulsoup

您可以使用 LXML 并遍历所有元素,询问它们的“类”属性的值。 LXML 是一个用于解析 XML 文档的库。

例如:

from lxml import etree
root = etree.parse(filename).getroot()

for span in root.iterdescendants("span"):
cls = span.attrib.get("class")

关于python - 我将如何使用 Beautiful Soup 提取此 HTML 元素属性的值?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/8188528/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com