gpt4 book ai didi

python - 在 Python 中提取 XML 节点

转载 作者:太空宇宙 更新时间:2023-11-04 01:40:25 25 4
gpt4 key购买 nike

这是我拥有的 XML 文档的一部分:

<tr><td>Image:</td><td>
<a href="http://live.astrometry.net/status.php?job=alpha-201104-6758393&amp;get=fullsize.png">fullsize.png</a></td></tr>

我需要提取 href 属性“在 <a> 元素之后的 <td> 元素,内容为‘Image:’”。 <a>元素没有其他我可以使用的 id 或 class 属性。

对不起,如果这听起来很复杂

提前致谢!

最佳答案

好的,最后的优雅(我希望 ;)用单个 XPath 表达式回答

from lxml import etree
root = etree.fromstring(your_text)
print root.xpath("//td[contains(text(), 'Image')]/following-sibling::td/a/@href")[0]

关于python - 在 Python 中提取 XML 节点,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/5587816/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com