gpt4 book ai didi

python - 从 XML 中删除 ns0、ns1、ns2 命名空间 - Python

转载 作者:行者123 更新时间:2023-12-04 16:51:21 24 4
gpt4 key购买 nike

我正在尝试使用 Python 的 lxml 库使用预先确定的命名空间重写 XML,但在重写时遇到了错误。我还尝试在覆盖 xml 时修改元素值,这似乎有效,但它随后附加 ns0、ns1 和 ns2 命名空间以代替它们预先分配的前缀。下面是我正在使用的代码,以及输入的 XML 和我得到的输出。

import xml.etree.ElementTree at ET
import os
import lxml
import glob

path = "C:\\Users\\mdl518\\Desktop\\" # contains the input XML

def tag_rename():

for filename in glob.glob(os.path.join(path, "*.xml")):
with open(filename, 'r', encoding='utf-8'):
my_namespaces = dict([node for _, node in ET.iterparse(filename, events=['start-ns'])])
ET.register_namespace=my_namespaces
tree=ET.parse(filename)
root=tree.getroot()

for elem in root.findall('.//{http://standards.iso.org/iso/19115/-3/cit/1.0}nameIdentifier'):
elem.tag = "{http://standards.iso.org/iso/19115/-3/cit/1.0}Test"

with open(os.path.join(path, "test_rewrite.xml"), "wb") as b:
tree.write(b)
tag_rename()
输入 XML:
<?xml version="1.0" encoding="UTF-8"?>
<?xml-stylesheet type="text/xsl" href="template.xsl"?>
<nas:Metadata xmlns:cit="http://standards.iso.org/iso/19115/-3/cit/1.0"
xmlns:gco="http://standards.iso.org/iso/19115/-3/gco/1.0"
xmlns:lan="http://standards.iso.org/iso/19115/-3/lan/1.0">
<gco:metadataIdentifier>
<lan:textIdentifier>
<cit:nameIdentifer>
</cit:nameIdentifier>
</lan:textIdentifier>
</gco:metadataIdentifier>
</nas:Metadata>
输出 XML:
<ns0:Metadata xmlns:ns3="http://standards.iso.org/iso/19115/-3/cit/1.0"
xmlns:ns1="http://standards.iso.org/iso/19115/-3/gco/1.0"
xmlns:ns2="http://standards.iso.org/iso/19115/-3/lan/1.0">
<ns1:metadataIdentifier>
<ns2:textIdentifier>
<ns3:Test>
</ns3:Test>
</ns2:textIdentifier>
</ns1:metadataIdentifier>
</ns0:Metadata>
我已经尝试了多种方法使用 lxml 和 eTree 来保留命名空间的原始前缀,但仍然无法弄清楚如何解决这个问题,非常感谢任何帮助!

最佳答案

我不得不对您的 xml 示例进行一些更改,包括创建一个 <root>拿着假货的标签nas命名空间声明。我还稍微修剪了脚本以处理单个文件。之后,只是切换到lxml的一个案例比 ElementTree 有更好的命名空间支持并在写入中添加一个参数。
测试文件

<?xml version="1.0" encoding="UTF-8"?>
<?xml-stylesheet type="text/xsl" href="template.xsl"?>
<root xmlns:nas="http://this/is/not/right">
<nas:Metadata xmlns:cit="http://standards.iso.org/iso/19115/-3/cit/1.0"
xmlns:gco="http://standards.iso.org/iso/19115/-3/gco/1.0"
xmlns:lan="http://standards.iso.org/iso/19115/-3/lan/1.0">
<gco:metadataIdentifier>
<lan:textIdentifier>
<cit:nameIdentifier>
</cit:nameIdentifier>
</lan:textIdentifier>
</gco:metadataIdentifier>
</nas:Metadata>
</root>
测试文件
import lxml.etree as ET
import os
import lxml
import glob

def tag_rename(filename):
with open(filename, 'r', encoding='utf-8'):
my_namespaces = dict([node
for _, node in ET.iterparse(filename, events=['start-ns'])])
for item in my_namespaces.items():
print(item)
ET.register_namespace=my_namespaces
tree=ET.parse(filename)
root=tree.getroot()

for elem in root.findall('.//{http://standards.iso.org/iso/19115/-3/cit/1.0}nameIdentifier'):
elem.tag = "{http://standards.iso.org/iso/19115/-3/cit/1.0}Test"
with open("output.xml", "wb") as b:
tree.write(b,xml_declaration=True)

tag_rename("test.xml")
输出文件
<?xml version='1.0' encoding='ASCII'?>
<?xml-stylesheet type="text/xsl" href="template.xsl"?><root xmlns:nas="http://this/is/not/right">
<nas:Metadata xmlns:cit="http://standards.iso.org/iso/19115/-3/cit/1.0" xmlns:gco="http://standards.iso.org/iso/19115/-3/gco/1.0" xmlns:lan="http://standards.iso.org/iso/19115/-3/lan/1.0">
<gco:metadataIdentifier>
<lan:textIdentifier>
<cit:Test>
</cit:Test>
</lan:textIdentifier>
</gco:metadataIdentifier>
</nas:Metadata>

关于python - 从 XML 中删除 ns0、ns1、ns2 命名空间 - Python,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/62544576/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com