gpt4 book ai didi

python - Python -lxml xpath返回空列表

转载 作者:行者123 更新时间:2023-12-03 16:51:47 26 4
gpt4 key购买 nike

我正在读取xliff文件,并计划检索特定元素。我尝试使用打印所有元素

from lxml import etree
with open('path\to\file\.xliff', 'r',encoding = 'utf-8') as xml_file:
tree = etree.parse(xml_file)
root = tree.getroot()
for element in root.iter():
print("child", element)


输出是

child <Element {urn:oasis:names:tc:xliff:document:2.0}segment at 0x6b8f9c8>
child <Element {urn:oasis:names:tc:xliff:document:2.0}source at 0x6b8f908>


当我尝试获取特定元素时(借助此处的许多帖子)-源标签

segment = tree.xpath('{urn:oasis:names:tc:xliff:document:2.0}segment')
print(segment)


它返回一个空列表。有人可以告诉我如何正确检索它。

输入:

<?xml version='1.0' encoding='UTF-8'?>
<xliff xmlns="urn:oasis:names:tc:xliff:document:2.0" version="2.0">

<segment id = 1>
<source>
Hello world
</source>
</segment>
<segment id = 2 >
<source>
2nd statement
</source>
</segment>
</xliff>


我想获取segment的值及其对应的来源

最佳答案

这段代码,

tree.xpath('{urn:oasis:names:tc:xliff:document:2.0}segment')


不被lxml接受(“ lxml.etree.XPathEvalError:无效表达式”)。您需要使用 findall()

以下工作(在XML示例中, segment元素是 xliff的子元素):

from lxml import etree

tree = etree.parse("test.xliff") # XML in the question; ill-formed attributes corrected
segment = tree.findall('{urn:oasis:names:tc:xliff:document:2.0}segment')
print(segment)


但是,实际的XML显然更复杂( segment不是 xliff的直接子代)。然后,您需要添加 .//来搜索整个树:

segment = tree.findall('.//{urn:oasis:names:tc:xliff:document:2.0}segment')

关于python - Python -lxml xpath返回空列表,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/45669258/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com