gpt4 book ai didi

python - 浏览 lxml 类别

转载 作者:行者123 更新时间:2023-12-05 04:18:53 28 4
gpt4 key购买 nike

我有一个解析网络,现在我想浏览标签,或显示图表。我怎样才能得到图表?或者在树中导航。显示第一步然后其他等。并了解这棵树是如何 build 的。

import urllib
from lxml import etree
import StringIO
resultado=urllib.urlopen('trozo.html')
html = resultado.read()
parser= etree.HTMLParser()
tree=etree.parse(StringIO.StringIO(html),parser)

我只想检查节点!图表会很酷,但我只想检查一下!

最佳答案

你实现了解析,如果你执行以下操作你可以看到:

>>> tree
<lxml.etree._ElementTree object at 0x0148AF08>

现在您可以使用 lxml._ElementTree 函数遍历此元素,记录在此处:http://lxml.de/tutorial.html

以下是一些基础知识,以及我从本地网络获得的一个简单文件:

>>> tree.getroot()
<Element html at 147aae0>
>>> tree.getroot().tag
'html'
>>> tree.getroot().text
>>> for child in tree.getroot().getchildren():
print child.tag, child.getchildren()
head
body
>>> for child in tree.getroot().getchildren():
print child.tag, [sub_child.tag for sub_child in child.getchildren()]
head ['title']
body ['h1', 'p', 'hr', 'address']

关于python - 浏览 lxml 类别,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/7918240/

28 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com