gpt4 book ai didi

python - 验证列内容时解析表元素的 lxml 语法错误

转载 作者:行者123 更新时间:2023-12-01 06:00:36 24 4
gpt4 key购买 nike

我有以下代码来解析 html 表。如何检查 <td> 中的指定文本元素?这不起作用:val=doc.xpath('//tr/td[child::*[text()="Street :"]/span/text()') 。我正在尝试提取 <span>仅当 <td> 时才显示文本文本与“街道:”匹配。非常感谢任何反馈!

import lxml.html as lh

html='''<tr>
<td>
Street : <span> High St. </span>
</td>
</tr>
<tr>
<td>
City : <span> Hightstown </span>
</td>
</tr>'''

doc=lh.fromstring(html)

#val=doc.xpath('//tr/td[child::*[text()="Street :"]/span/text()')
#street=doc.xpath('//tr/td/text()')
val=doc.xpath('//tr/td/span/text()')

#print street
print val

最佳答案

>>> doc.xpath('//tr/td[contains(text(),"Street :")]/span/text()')
[' High St. ']

关于python - 验证列内容时解析表元素的 lxml 语法错误,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/10658438/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com