gpt4 book ai didi

python - 无法使用lxml获取连接到特定标签的html元素

转载 作者:太空宇宙 更新时间:2023-11-04 04:24:59 24 4
gpt4 key购买 nike

我创建了一个 xpath 表达式来从一些 html 元素中获取 a 标记。问题是我无法在控制台中打印它。

我希望得到的是使用 lxml 库连接到标签 a 的相关 html 元素。

这是我的尝试:

from lxml.html import fromstring

htmlcontent = """
<div class="post-taglist">
<div class="grid">
<a href="/questions/tagged/python"></a>
</div>
</div>
"""
root = fromstring(htmlcontent)
item = root.xpath("//*[@class='grid']/a")[0]
print(item)

我想要得到的输出:

<a href="/questions/tagged/python"></a>

我该怎么做?我用谷歌搜索了很多搜索词,但找不到这个问题的任何直接答案。

最佳答案

尝试以下,基于 docs :

from lxml.html import fromstring, tostring

htmlcontent = """
<div class="post-taglist">
<div class="grid">
<a href="/questions/tagged/python"></a>
</div>
</div>
"""

root = fromstring(htmlcontent)
item = root.xpath("//*[@class='grid']/a")[0]

print(tostring(item).strip())

结果是:

<a href="/questions/tagged/python"></a>

关于python - 无法使用lxml获取连接到特定标签的html元素,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/53669114/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com