gpt4 book ai didi

python - 我如何在 python lxml、XPath 中使用正则表达式

转载 作者:太空宇宙 更新时间:2023-11-03 13:39:15 26 4
gpt4 key购买 nike

我正在尝试:

for element in root.xpath('//a[@id="hypProduct_[0-9]+"]'):

如何在 xpath 元素选择器 (lxml) 中使用 [0-9]+?文档状态:

By default, XPath supports regular expressions in the EXSLT namespace:

>>> regexpNS = "http://exslt.org/regular-expressions"
>>> find = etree.XPath("//*[re:test(., '^abc$', 'i')]",
... namespaces={'re':regexpNS})

>>> root = etree.XML("<root><a>aB</a><b>aBc</b></root>")
>>> print(find(root)[0].text)
aBc

You can disable this with the boolean keyword argument regexp which defaults to True.

我没有遵循 :test 的内容。有人可以在文档的上下文中对此进行解释。

最佳答案

在您的情况下,表达式将是:

//a[re:test(@id, "^hypProduct_[0-9]+$")]

演示:

>>> from lxml.html import fromstring
>>>
>>> data = '<a id="hypProduct_10">link1</a>'
>>> tree = fromstring(data)
>>> tree.xpath('//a[re:test(@id, "^hypProduct_[0-9]+$")]', namespaces={'re': "http://exslt.org/regular-expressions"})[0].attrib["id"]
'hypProduct_10'

关于python - 我如何在 python lxml、XPath 中使用正则表达式,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/34504978/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com