gpt4 book ai didi

python XML 获取

...

标签内的文本

转载 作者:行者123 更新时间:2023-12-01 03:39:06 24 4
gpt4 key购买 nike

各位,我有一个 xml 结构,看起来有点像这样。

<abstract>
<p id = "p-0001" num = "0000">
blah blah blah
</p>
</abstract>

我想提取<p> <abstract> 内的标签仅标记。

我尝试过:

import xml.etree.ElementTree as ET

xroot = ET.parse('100/A/US07640598-20100105.XML').getroot()

for row in xroot.iter('p'):
print row.text

这得到了所有 <p>我的 xml 中的标记这不是一个好主意。

无论如何我可以提取里面的文本

我想要的输出是提取“blah blah blah”

最佳答案

您可以使用 XPath 表达式 专门搜索 abstract 内的 p 元素:

for p in xroot.xpath(".//abstract//p"):
print(p.text.strip())

或者,如果使用iter(),您可能有一个嵌套循环:

for abstract in xroot.iter('abstract'):
for p in abstract.iter('p'):
print(p.text.strip())

关于python XML 获取 <p>...</p> 标签内的文本,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/39950810/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com