gpt4 book ai didi

python - Python XML解析和生成中的区别

转载 作者:行者123 更新时间:2023-12-01 04:57:59 33 4
gpt4 key购买 nike

我一直在使用 Python 的 ElementTree 创建 XML 文档,到目前为止一切顺利。然而我现在面临的问题是,由于项目要求,我需要生成一个 XML 文档,其中包含带有开始和结束标签的元素以及自关闭标签元素。我需要输出带有开始/结束标签的空标签,并保留自闭合标签元素。当前的实现要么在存在空元素时生成自关闭标签,从而保留自关闭标签,但由于项目要求,这是不正确的。另外,如果我强制空元素的开始/结束标签,自闭合标签也会转换为开始/结束标签元素,这也不正确。

有人可以帮助我并指出一种可能的解决方案吗?欢迎任何建议。我需要使用Python 2.7。谢谢。

最佳答案

就 XML 标准而言,空标签与自闭合标签的含义完全相同。

所以,首先,这可能不是一个好主意。

其次,大多数 XML 库可能不会让您区分两者。

但是如果您需要这样做,您可以随时修补任何您想要的库。由于您已经在使用 ElementTree,这似乎是修补的明显选择。

<小时/>

在最新版本的 ElementTree 中(包括 Python 3.4+ 附带的版本,但在较旧的 Python 中,您需要安装最新的外部维护版本),您实际上可以控制它全局,将 short_empty_elements 参数设置为 write及相关功能。但是,正如您所说,这不是您真正想要的;您需要一些元素能够自动关闭,而另一些则不需要。

我认为您最好从 ElementTree 的外部维护版本开始,而不是从 Python 2.7 内置的版本开始。但我不确定它的官方存储库在哪里,所以我将链接到 Python 3.4 代码。希望这足以让您从那里开始。

关键函数是serialize_xml 。我认为该函数不是 C 加速的,因此您只需更改纯 Python 版本。在这种情况下,它只是一行:

if text or len(elem) or not short_empty_elements:

将其更改为:

if text or len(elem) or not getattr(elem, 'short_empty', short_empty_elements):

现在,如果您在空节点上设置 node.short_empty = Truenode.short_empty = False,它将覆盖 short_empty_elements 的全局设置.

<小时/>

除了……我认为如果您使用 C 加速器,则无法将属性(我的意思是 Python 属性,如 node.short_empty,而不是 XML 属性)添加到 Element 。这意味着您需要修补Element以允许这样做(is partly in C -您必须不禁用__dict__并修改else 调用 PyObject_GenericSetAttr 而不是引发),或者通过使用一些伪造的 XML 属性(在序列化时将其删除)来伪造它。

当然,如果您在 2.7 中使用 ElementTree 而不是 cElementTree,则您没有使用 C 加速器,因此您可能不需要担心这部分。

<小时/>

您可能需要考虑查看 lxml ElementTree API 的实现,看看它是否更容易修补。

<小时/>

同时,考虑到他们已将 short_empty_elements 添加到库中,维护人员可能有兴趣接受您的上游补丁。

关于python - Python XML解析和生成中<foo/>和<foo></foo>的区别,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/26941178/

33 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com