gpt4 book ai didi

Python lxml提取span标签的值

转载 作者:行者123 更新时间:2023-12-01 03:04:14 26 4
gpt4 key购买 nike

我正在尝试从网站的源代码中获取跨度标签的值。但我只想要如下所示的跨度标签:

<span>
Test
</span>

不是这样的:

<span class="test">blabla</span>

我当前的代码如下所示:

test = tree.xpath('//span[@class]/text()')

最佳答案

使用 Xpath,您可以使用谓词 not(@*) 指定 span 元素不应该有任何属性:

from lxml import etree

x = '''<body>
<span>
Test
</span>
<span class="test">blabla</span>
</body>'''

xml = etree.fromstring(x)
xml.xpath('//span[not(@*)]/text()')

# returns:
['\n Test\n']

关于Python lxml提取span标签的值,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/43561656/

26 4 0