python - 使用 ElementTree 解析任意 XML 文件-6ren

python - 使用 ElementTree 解析任意 XML 文件

转载作者：数据小太阳更新时间：2023-10-29 02:06:38

35

4

我有一个模板 XML 文件，根据我的程序的输入，我必须生成一个新的 XML 文件。该模板包含需要根据输入数据重复的部分。但是我不一定知道这些部分的结构或者它们有多少层嵌套。我无法弄清楚如何以任意方式读取模板文件，他们会让我填充它然后输出它。这是模板文件的一部分:

<Target_Table>
  <Target_Name>SF1_T1</Target_Name>
  <Target_Mode>
    <REP>
      <Target_Location_To_Repeat>
        <XLocation>nextXREL</XLocation>
        <YLocation>nextYREL</YLocation>
      </Target_Location_To_Repeat>
   <Target_Location_To_Repeat>
        <XLocation>nextXREL</XLocation>
        <YLocation>nextYREL</YLocation>
      </Target_Location_To_Repeat>
    </REP>
  </Target_Mode>
  <Target_Repetitions>1</Target_Repetitions>
  <Meas_Window>
    <Window_Size>
      <XLocation>FOV</XLocation>
      <YLocation>FOV</YLocation>
    </Window_Size>
    <Window_Location>
      <XLocation>firstXREL</XLocation>
      <YLocation>firstYREL</YLocation>
    </Window_Location>
  </Meas_Window>
  <Box_Orientation>90</Box_Orientation>
  <First_Feature Value="Space" />
  <Meas_Params_Definition>
    <Number_Of_Lines Value="Auto" />
    <Number_Of_Pixels_Per_Line Value="Auto" />
    <Averaging_Factor Value="1" />
  </Meas_Params_Definition>
  <Number_Of_Edges>1</Number_Of_Edges>
  <Edge_Pair>
    <Edge_Pair_Couple>
      <First_Edge>1</First_Edge>
      <Second_Edge>1</Second_Edge>
    </Edge_Pair_Couple>
    <Nominal_Corrected_Value>0</Nominal_Corrected_Value>
  </Edge_Pair>
  <Categories>
    <Material_Type />
    <Meas_Type />
    <Category_Type />
    <Other_Type />
  </Categories>
  <Bias>0</Bias>
  <Template_Target_Name>SF_IMAQ_Template_Target</Template_Target_Name>
  <Template_Target_PPL>
    <Process>PC2</Process>
    <Product>PD2</Product>
    <Layer>L2</Layer>
  </Template_Target_PPL>
  <Meas_Auto_Box>
    <Error_Code>0</Error_Code>
    <Measured_CD>0</Measured_CD>
    <Constant_NM2Pix>true</Constant_NM2Pix>
  </Meas_Auto_Box>
  <Meas_Box_Pix_Size_X>PixelSize</Meas_Box_Pix_Size_X>
  <Macro_CD>0</Macro_CD>
</Target_Table>

我需要多次重复整个 Target_Table 部分，并且在每个 Target_Table 中我需要多次重复 REP 部分。我想编写我的程序，以便如果模板发生变化(例如，添加了更多级别的嵌套)，我不必更改我的程序。但在我看来，我必须完全了解文件的结构才能将其读入并吐出。那是真的还是我在这里遗漏了什么？有没有办法编写一个程序来读取具有未知标签和未知嵌套级别的文件？

最佳答案

使用元素树:

import xml.etree.ElementTree as et

filehandler = open("file.xml","r")
raw_data = et.parse(filehandler)
data_root = raw_data.getroot()
filehandler.close()

for children in data_root:
    for child in children:
        print(child.tag, child.text, children.tag, children.text)

这将使您大致了解 XML 标签和标签内的相关文本。您可以添加更多循环以进一步进入树中，并执行检查以查看是否有任何子级包含更多级别。当 XML 标记的名称不同并且不遵循已知标准时，我发现此方法很有用。

关于python - 使用 ElementTree 解析任意 XML 文件，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/15512803/

35

4

0

文章推荐： c# - XML 反序列化 : different xml schema maps to the same C# class

文章推荐： go - 将 golang S2 几何库与 dynamodb 一起使用

文章推荐： go - GoLand 中如何查看当前包的名称？

文章推荐： xml - 如何创建有效的内联 XML 架构？

python - ElementTree 返回元素而不是 ElementTree
我正在尝试从字符串构建ElementTree。当我执行以下操作时(如 Python ElementTree: Parsing a string and getting ElementTree inst
python - 为什么 elementtree.ElementTree.iterparse 使用这么多内存？
我正在使用 elementtree.ElementTree.iterparse 来解析大型 (371 MB) xml 文件。我的代码基本上是这样的: outf = open('out.txt', '
Python:忽略 elementtree.ElementTree 中的 xmlns
有没有办法在 elementtree.ElementTree 中忽略标记名称中的 XML 命名空间？我尝试打印所有 technicalContact 标签: for item in root.get
python: xml.etree.elementtree.ElemenTtree.write() 声明标签
我使用 xml.etree.elementtree.Element 创建了一个 XML 文档，并想使用 ElementTree.write() 函数打印它但是出来的声明标签是虽然我需要用双引号引起
python - 将重音字符转换为拉丁字符而不影响 ElementTree
这个问题已经有答案了: What is the best way to remove accents (normalize) in a Python unicode string? (14 个回答)
python - ElementTree - 将子元素附加到元素时出现问题
我想为此处元素国家/地区新加坡旁边的元素创建子元素。假设我的 test.xml 文件如下所示 2008 141100
Python开发-elementtree XML和字符串操作
我正在使用ElementTree加载一系列 XML 文件并解析它们。解析文件时，我将从其中获取一些数据(标题和文本段落)。然后我需要获取一些存储在 XML 中的文件名。它们包含在名为 ContentI
Python ElementTree 复制带有子节点的节点
我必须将多个 XML 文件合并为一个。此外，新文件的结构也不同。这是我的“旧”结构: 1
python - Elementtree，检查元素是否有特定的父元素？
我正在解析一个 xml 文件:http://pastebin.com/fw151jQN我希望在副本中读取它的大部分内容并将其写入一个新文件，其中一些已修改，很多未修改，还有很多被忽略。作为初始阶段，我
Python elementtree 很难提取数据
这是 XML: TARGET_NAME_1 5 a string goes here TARGET_NA
python - Elementtree 转储给出错误答案
from lxml import etree from xml.etree.ElementTree import Element, SubElement, dump listing = Element
python导入xml不包含xml.etree.ElementTree
当涉及到模块/库时，为了可读性，我喜欢在 python 中使用完整的命名空间。我想知道为什么这对 xml 库不起作用。我认为 import xml 还将导入 etree 和命名空间中的所有其他内容。至
python - ElementTree 删除元素
这里是 Python 菜鸟。想知道删除所有 updated 属性值为 true 的“profile”标签的最干净、最好的方法是什么。我已经尝试了下面的代码，但它抛出了:SyntaxError("ca
Python ElementTree 从根目录中删除元素时出错
尝试从 xml 文档中删除元素时出现以下错误。“ValueError: list.remove(x): x 不在列表中”这是代码，错误发生在删除的行上。 import xml.etree.Elemen
Python ElementTree 重复检查器
所以我必须编写一个“重复检查器”来比较两个 XML，看看它们是否相同(包含相同的数据)。现在因为它们来自同一个类并且是从 XSD 结构中生成的，所以内部元素的顺序很可能是相同的。我能想到的进行重复检
Python ElementTree 编写多个命名空间
我有一个 XML 文档，我正在使用 ElementTree 阅读和附加该文档。这有多个命名空间声明。据我所知，ElementTree 只允许声明一个全局命名空间: ET.register_namesp
python/elementtree xml解析成数组
从这里开始: stuff
Python ElementTree 发现不工作
我是 ElementTree 的新手。我正在尝试获取来自 XML 响应的值。以下代码对我不起作用。如何提取中的值？我不确定号码在哪里 53是从这里来的。 ... r = req
Python ElementTree 不喜欢处理指令名称中的冒号
以下代码: import xml.etree.ElementTree as ET xml = '''\ ''' root = ET.fromstring(xml)
python - ElementTree 命名空间不方便
我无法控制我获得的 XML 的质量。在某些情况下是: ... 在其他方面我得到: ... 我想我也应该处理 ... 整个架构都是相同的，我只需要一个解析器来处理它。我该如何处理所有这些

首页

博学

6Ren·AI

商城

python - 使用 ElementTree 解析任意 XML 文件