gpt4 book ai didi

python - 使用python从xml数据中提取所有文本

转载 作者:数据小太阳 更新时间:2023-10-29 02:29:51 26 4
gpt4 key购买 nike

我是 xml 数据处理的新手。我想提取以下 xml 文件中的文本数据:

<data>
<p>12345<strong>45667</strong>abcde</p>
</data>

所以预期的结果是: ['12345','45667', 'abcde'] 目前我已经尝试过:

tree = ET.parse('data.xml')
data = tree.getiterator()
text = [data[i].text for i in range(0, len(data))]

但结果只显示 ['12345','45667']'abcde' 丢失。有人能帮我吗?提前致谢!

最佳答案

尝试使用 执行此操作:

import lxml.etree as etree

string = '''
<data>
<p>12345<strong>45667</strong>abcde</p>
</data>
'''

tree = etree.fromstring(string)

print(tree.xpath('//p//text()'))

Xpath 表达式的意思是:“递归地选择所有包含 textp 元素”

输出:

['12345', '45667', 'abcde']

关于python - 使用python从xml数据中提取所有文本,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/27786007/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com