gpt4 book ai didi

python - lxml 失败的 XPath

转载 作者:太空狗 更新时间:2023-10-30 01:45:06 24 4
gpt4 key购买 nike

我正在尝试使用 XPath 查询使用 lxml 解析的 html 文档。该文档是关于 Plastic in Wikipedia 页面的纯 html 纯下载。 .然后我用 lxml 禁用实体替换来解析它以避免 '®' 错误

from lxml import etree
root = etree.parse("plastic.html",etree.XMLParser(resolve_entities=False))

然后,我检索命名空间 url

htmltag = root.iter().next()
nsurl = htmltag.nsmap.values()[0]

现在,我想在“root”或“htmltag”上使用 xpath 查询,但我做不到。我尝试了不同的方法,但在我看来,以下是最正确的形式,但无论如何都会产生错误。

root.xpath('//ns:body',namespace={'ns',nsurl})

这就是我得到的

XPathResultError: Unknown return type: dict

我在 IPython 控制台中运行命令,但我认为这不是问题所在。我做错了什么?

最佳答案

这是一个简单的未命中咒语。您应该使用 namespaces 而不是 namespace

关于python - lxml 失败的 XPath,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/9474838/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com