gpt4 book ai didi

python - 使用原始顺序的 lxml xpath 获取 xml 中的所有文本节点

转载 作者:太空宇宙 更新时间:2023-11-04 00:53:07 24 4
gpt4 key购买 nike

<a>
aaaa
<b>
bbbb
</b>
cccc
<d>
dddd
<f>
ffff
</f>
gggg
</d>
eeee
</a>

如何使用 lxml 和 xpath 获取列表。结果必须是 [aaaa,bbbb,cccc,dddd,fff,gggg,eeee]。我可以使用函数 xpath(u"/descendant::[text()]") 和xpath(u"/descendant::[text()]") 得到结果,但是顺序不对

最佳答案

>>> xml = "<a>aaaa<b>bbbb</b>cccc<d>dddd<f>ffff</f>gggg</d>eeee</a>"
>>> root = lxml.etree.fromstring(xml)
>>> root.xpath(".//text()")
['aaaa', 'bbbb', 'cccc', 'dddd', 'ffff', 'gggg', 'eeee']

关于python - 使用原始顺序的 lxml xpath 获取 xml 中的所有文本节点,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/36263753/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com