gpt4 book ai didi

python - 使用 python(具有 xmlns 属性)的 XML 解析不起作用

转载 作者:太空宇宙 更新时间:2023-11-04 10:44:12 25 4
gpt4 key购买 nike

这是我第一次尝试用 python 解析 XML,所以答案可能很简单,但我想不通。

我正在使用 ElementTree 来解析一些 XML 文件。问题是当具有此属性时,我无法在树中获得任何结果:

<package xmlns="http://apple.com/itunes/importer" version="software5.1">

删除此属性后一切正常。明确地说,我的意思是将 XML 文件的第一行更改为:

<package>

一切正常。

我做错了什么?

这是我的代码:

import xml.etree.ElementTree as ET

tree = ET.parse('metadataCopy.xml')
root = tree.getroot()

p = root.find(".//intervals/interval")

print p
for interval in root.iterfind(".//intervals/interval"):
start_date = interval.find('start_date').text
end_date = interval.find('end_date').text
print start_date, end_date

请帮忙。谢谢!

更新:XML 文件:

<?xml version="1.0" encoding="UTF-8"?>
<package xmlns="http://apple.com/itunes/importer" version="software5.1">
<metadata_token>TOKEN</metadata_token>
<provider>Provider Name</provider>
<team_id>Team_ID_Here</team_id>
<software>
<!--Apple ID: 01234567-->
<vendor_id>vendorSKU</vendor_id>
<read_only_info>
<read_only_value key="apple-id">01234567</read_only_value>
</read_only_info>
<software_metadata>
<versions>
<version string="1.0">
<locales>
<locale name="en-US">
<title>title text</title>
<description>Description text</description>
<keywords>
<keyword>key1</keyword>
<keyword>key2</keyword>
</keywords>
<version_whats_new>New things here</version_whats_new>
<support_url>http://someurl.com</support_url>
<software_screenshots>
<software_screenshot display_target="iOS-3.5-in" position="1">

</software_screenshot>
<software_screenshot display_target="iOS-4-in" position="1">

</software_screenshot>
</software_screenshots>
</locale>
</locales>
</version>
</versions>
<products>
<product>
<territory>WW</territory>
<cleared_for_sale>true</cleared_for_sale>
<sales_start_date>2013-01-05</sales_start_date>
<intervals>
<interval>
<start_date>2013-08-25</start_date>
<end_date>2014-09-01</end_date>
<wholesale_price_tier>5</wholesale_price_tier>
</interval>
<interval>
<start_date>2014-09-01</start_date>
<wholesale_price_tier>6</wholesale_price_tier>
</interval>
</intervals>
<allow_volume_discount>true</allow_volume_discount>
</product>
</products>
</software_metadata>
</software>

最佳答案

这是因为,python 中的 xml 不能自动识别 namespace 。我们需要为树中的每个元素添加命名空间前缀以供查找。

    import xml.etree.ElementTree as ET

namespaces = {"pns" : "http://apple.com/itunes/importer"}
tree = ET.parse('metadataCopy.xml')
root = tree.getroot()

p = root.find(".//pns:intervals/pns:interval", namespaces=namespaces)

print p
for interval in root.iterfind(".//pns:intervals/pns:interval",namespaces=namespaces):
start_date = interval.find('pns:start_date',namespaces=namespaces)
end_date = interval.find('pns:end_date',namespaces=namespaces)
st_text = end_text = None
if start_date is not None:
st_text = start_date.text
if end_date is not None:
end_text = end_date.text
print st_text, end_text

共享的 xml 文件不是格式正确的 XML。最后一个标签必须以包标签结尾。完成此更改后,程序会生成:

<Element '{http://apple.com/itunes/importer}interval' at 0x178b350>
2013-08-25 2014-09-01
2014-09-01 None

如果可以更改库,您可以寻找使用 lxml 的方法。 lxml 对使用命名空间有很好的支持。在此处查看快速简短教程 http://lxml.de/tutorial.html#namespaces

关于python - 使用 python(具有 xmlns 属性)的 XML 解析不起作用,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/18552242/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com