Python利用ElementTree模块处理XML的方法详解-6ren

Python利用ElementTree模块处理XML的方法详解

转载作者：qq735679552 更新时间：2022-09-28 22:32:09

CFSDN坚持开源创造价值，我们致力于搭建一个资源共享平台，让每一个IT人在这里找到属于你的精彩世界.

这篇CFSDN的博客文章Python利用ElementTree模块处理XML的方法详解由作者收集整理，如果你对这篇文章有兴趣，记得点赞哟.

前言。

最近因为工作的需要，在使用 Python 来发送 SOAP 请求以测试 Web Service 的性能，由于 SOAP 是基于 XML 的，故免不了需要使用 python 来处理 XML 数据。在对比了几种方案后，最后选定使用 xml.etree.ElementTree 模块来实现.

这篇文章记录了使用 xml.etree.ElementTree 模块常用的几个操作，也算是总结一下，免得以后忘记了。分享出来也方法需要的朋友们参考学习，下面话不多说了，来一起看看详细的介绍吧.

概述。

对比其他 Python 处理 XML 的方案，xml.etree.ElementTree 模块（下文我们以 ET 来表示）相对来说比较简单，接口也较友好.

官方文档里面对 ET 模块进行了较为详细的描述，总的来说，ET 模块可以归纳为三个部分：ElementTree类，Element类以及一些操作 XML 的函数.

XML 可以看成是一种树状结构，ET 使用ElementTree类来表示整个 XML 文档，使用Element类来表示 XML 的一个结点。对整 XML 文档的操作一般是对ElementTree对象进行，而对 XML 结点的操作一般是对Element对象进行.

解析 XML 文件。

ET 模块支持从一个 XML 文件构造ElementTree对象，例如我们的 XML 文件example.xml内容如下（下文会继续使用这个 XML 文档）:

 
    ? 
   
 
     
       
       
         <? 
         xml 
         version 
         = 
         "1.0" 
         encoding 
         = 
         "utf-8" 
         ?> 
        
 
         < 
         data 
         > 
        
 
           
         < 
         country 
         name 
         = 
         "Liechtenstein" 
         > 
        
 
            
         < 
         rank 
         >1</ 
         rank 
         > 
        
 
            
         < 
         year 
         >2008</ 
         year 
         > 
        
 
            
         < 
         gdppc 
         >141100</ 
         gdppc 
         > 
        
 
            
         < 
         neighbor 
         name 
         = 
         "Austria" 
         direction 
         = 
         "E" 
         /> 
        
 
            
         < 
         neighbor 
         name 
         = 
         "Switzerland" 
         direction 
         = 
         "W" 
         /> 
        
 
           
         </ 
         country 
         > 
        
 
           
         < 
         country 
         name 
         = 
         "Singapore" 
         > 
        
 
            
         < 
         rank 
         >4</ 
         rank 
         > 
        
 
            
         < 
         year 
         >2011</ 
         year 
         > 
        
 
            
         < 
         gdppc 
         >59900</ 
         gdppc 
         > 
        
 
            
         < 
         neighbor 
         name 
         = 
         "Malaysia" 
         direction 
         = 
         "N" 
         /> 
        
 
           
         </ 
         country 
         > 
        
 
         </ 
         data 
         > 
        
 
     
 
   

可以使用 ET 模块的parse()函数来从指定的 XML 文件构造一个ElementTree对象:

 
    ? 
   
         import 
         xml.etree.ElementTree as ET 
        
         # 获取 XML 文档对象 ElementTree 
        
         tree  
         = 
         ET.parse( 
         'example.xml' 
         ) 
        
         # 获取 XML 文档对象的根结点 Element 
        
         root  
         = 
         tree.getroot() 
        
         # 打印根结点的名称 
        
         print 
         root.tag

从 XML 文件构造好ElementTree对象后，还可以获取其结点，或者再继续对结点进行进一步的操作.

解析 XML 字符串。

ET 模块的fromstring()函数提供从 XML 字符串构造一个Element对象的功能.

 
    ? 
   
         xml_str  
         = 
         ET.tostring(root) 
        
         print 
         xml_str 
        
         root  
         = 
         ET.fromstring(xml_str) 
        
         print 
         root.tag

接着上面的代码，我们使用 ET 模块的tostring()函数来将上面我们构造的root对象转化为字符串，然后使用fromstring()函数重新构造一个Element对象，并赋值给root变量，这时root代表整个 XML 文档的根结点.

构造 XML 。

如果我们需要构造 XML 文档，可以使用 ET 模块的 Element类以及SubElement()函数.

可以使用Element类来生成一个Element对象作为根结点，然后使用ET.SubElement()函数生成子结点.

 
    ? 
   
 
     
       
       
         a  
         = 
         ET.Element( 
         'a' 
         ) 
        
 
         b  
         = 
         ET.SubElement(a,  
         'b' 
         ) 
        
 
         b.text  
         = 
         'leehao.me' 
        
 
         c  
         = 
         ET.SubElement(a,  
         'c' 
         ) 
        
 
         c.attrib[ 
         'greeting' 
         ]  
         = 
         'hello' 
        
 
         d  
         = 
         ET.SubElement(a,  
         'd' 
         ) 
        
 
         d.text  
         = 
         'www.leehao.me' 
        
 
         xml_str  
         = 
         ET.tostring(a, encoding 
         = 
         'UTF-8' 
         ) 
        
 
         print 
         xml_str 
        
 
     
 
   

输出:

 
    ? 
   
         <?xml version='1.0' encoding='UTF-8'?> 
        
         <a><b>leehao.me</b><c greeting="hello" /><d>www.leehao.me</d></a>

如果需要输出到文件中，可以继续使用ElementTree.write()方法来处理:

 
    ? 
   
         # 先构造一个 ElementTree 以便使用其 write 方法 
        
         tree  
         = 
         ET.ElementTree(a) 
        
         tree.write( 
         'a.xml' 
         , encoding 
         = 
         'UTF-8' 
         )

执行后，便会生成一个 XML 文件a.xml

 
    ? 
   
 
     
       
       
         <? 
         xml 
         version 
         = 
         '1.0' 
         encoding 
         = 
         'UTF-8' 
         ?> 
        
 
         < 
         a 
         >< 
         b 
         >leehao.me</ 
         b 
         >< 
         c 
         greeting 
         = 
         "hello" 
         />< 
         d 
         >www.leehao.me</ 
         d 
         ></ 
         a 
         > 
        
 
     
 
   

XML 结点的查找与更新。

1. 查找 XML 结点。

Element类提供了Element.iter()方法来查找指定的结点。Element.iter()会递归查找所有的子结点，以便查找到所有符合条件的结点.

 
    ? 
   
         # 获取 XML 文档对象 ElementTree 
        
         tree  
         = 
         ET.parse( 
         'example.xml' 
         ) 
        
         # 获取 XML 文档对象的根结点 Element 
        
         root  
         = 
         tree.getroot() 
        
         # 递归查找所有的 neighbor 子结点 
        
         for 
         neighbor  
         in 
         root. 
         iter 
         ( 
         'neighbor' 
         ): 
        
         print 
         neighbor.attrib

输出:

 
    ? 
   
 
     
       
       
         { 
         'direction' 
         :  
         'E' 
         ,  
         'name' 
         :  
         'Austria' 
         } 
        
 
         { 
         'direction' 
         :  
         'W' 
         ,  
         'name' 
         :  
         'Switzerland' 
         } 
        
 
         { 
         'direction' 
         :  
         'N' 
         ,  
         'name' 
         :  
         'Malaysia' 
         } 
        
 
     
 
   

如果使用Element.findall()或者Element.find()方法，则只会从结点的直接子结点中查找，并不会递归查找.

 
    ? 
   
         for 
         country  
         in 
         root.findall( 
         'country' 
         ): 
        
         rank  
         = 
         country.find( 
         'rank' 
         ).text 
        
         name  
         = 
         country.get( 
         'name' 
         ) 
        
         print 
         name, rank

输出:

 
    ? 
   
         Liechtenstein  
         1 
        
         Singapore  
         4

2. 更新结点。

如果需要更新结点的文本，可以通过直接修改Element.text来实现。如果需要更新结点的属性，可以通过直接修改Element.attrib来实现.

对结点进行更新后，可以使用ElementTree.write()方法将更新后的 XML 文档写入文件中.

 
    ? 
   
         # 获取 XML 文档对象 ElementTree 
        
         tree  
         = 
         ET.parse( 
         'example.xml' 
         ) 
        
         # 获取 XML 文档对象的根结点 Element 
        
         root  
         = 
         tree.getroot() 
        
         for 
         rank  
         in 
         root. 
         iter 
         ( 
         'rank' 
         ): 
        
         new_rank  
         = 
         int 
         (rank.text)  
         + 
         1 
        
         rank.text  
         = 
         str 
         (new_rank) 
        
         rank.attrib[ 
         'updated' 
         ]  
         = 
         'yes' 
        
         tree.write( 
         'output.xml' 
         , encoding 
         = 
         'UTF-8' 
         )

新生成的output.xml文件以下:

 
    ? 
   
 
     
       
       
         <?xml version 
         = 
         '1.0' 
         encoding 
         = 
         'UTF-8' 
         ?> 
        
 
         <data> 
        
 
           
         <country name 
         = 
         "Liechtenstein" 
         > 
        
 
            
         <rank updated 
         = 
         "yes" 
         > 
         2 
         < 
         / 
         rank> 
        
 
            
         <year> 
         2008 
         < 
         / 
         year> 
        
 
            
         <gdppc> 
         141100 
         < 
         / 
         gdppc> 
        
 
            
         <neighbor direction 
         = 
         "E" 
         name 
         = 
         "Austria" 
         / 
         > 
        
 
            
         <neighbor direction 
         = 
         "W" 
         name 
         = 
         "Switzerland" 
         / 
         > 
        
 
           
         < 
         / 
         country> 
        
 
           
         <country name 
         = 
         "Singapore" 
         > 
        
 
            
         <rank updated 
         = 
         "yes" 
         > 
         5 
         < 
         / 
         rank> 
        
 
            
         <year> 
         2011 
         < 
         / 
         year> 
        
 
            
         <gdppc> 
         59900 
         < 
         / 
         gdppc> 
        
 
            
         <neighbor direction 
         = 
         "N" 
         name 
         = 
         "Malaysia" 
         / 
         > 
        
 
           
         < 
         / 
         country> 
        
 
         < 
         / 
         data> 
        
 
     
 
   

对比example.xml文件，可以看到output.xml文件已更新.

总结。

以上就是这篇文章的全部内容了，希望本文的内容对大家的学习或者工作能带来一定的帮助，如果有疑问大家可以留言交流，谢谢大家对我的支持.

参考资料。

https://docs.python.org/2/library/xml.html#xml-vulnerabilities
https://stackoverflow.com/questions/1912434/how-do-i-parse-xml-in-python

原文链接：http://blog.csdn.net/lihao21/article/details/72891932 。

最后此篇关于Python利用ElementTree模块处理XML的方法详解的文章就讲到这里了,如果你想了解更多关于Python利用ElementTree模块处理XML的方法详解的内容请搜索CFSDN的文章或继续浏览相关文章，希望大家以后支持我的博客！。

文章推荐：利用Python爬取微博数据生成词云图片实例代码

文章推荐： php stream_get_meta_data返回值

文章推荐：爱笑的女生头像高清甜美可爱爱笑的女孩运气都不会差

文章推荐： go和python变量赋值遇到的一个问题

jstat 详解
全称“Java Virtual Machine statistics monitoring tool”（statistics 统计；monitoring 监控；tool 工具）用于监控虚拟机的各种运
MongoDB索引操作和执行计划Explain()详解
主要是讲下Mongodb的索引的查看、创建、删除、类型说明，还有就是Explain执行计划的解释说明。可以转载，但请注明出处。
Linux下几种并发服务器的实现模式(详解)
1>单线程或者单进程相当于短链接，当accept之后，就开始数据的接收和数据的发送，不接受新的连接，即一个server，一个client 不存在并发。 2>循环服务器和并发服务器
详解 Linux中的关机和重启命令
详解 linux中的关机和重启命令一 shutdown命令 shutdown [选项] 时间选项： ?
用Newtonsoft将json串转为对象的方法(详解)
首先，将json串转为一个JObject对象： ? 1
Python画图常用命令大全(详解)
matplotlib官网 matplotlib库默认英文字体添加黑体（‘SimHei'）为绘图字体代码： plt.rcParams['font.sans-serif']=['SimHei'
Java中的关键字synchronized 详解
在并发编程中，synchronized关键字是常出现的角色。之前我们都称呼synchronized关键字为重量锁，但是在jdk1.6中对synchronized进行了优化，引入了偏向锁、轻量锁。本篇
详解.NET数据库连接池
一般我们的项目中会使用1到2个数据库连接配置，同程艺龙的数据库连接配置被收拢到统一的配置中心，由DBA统一配置和维护，业务方通过某个字符串配置拿到的是Connection对象。
linux下gettimeofday函数windows替换方法(详解)
实例如下： ? 1
详解.Net缓存之MemoryCahe
1. MemoryCahe NetCore中的缓存和System.Runtime.Caching很相似，但是在功能上做了增强，缓存的key支持object类型；提供了泛型支持；可以读缓存和单个缓存
Javascript基础教程之argument 详解
argument是javascript中函数的一个特殊参数，例如下文，利用argument访问函数参数，判断函数是否执行复制代码代码如下: <script
linux中了minerd之后的完全清理过程(详解)
一不小心装了一个Redis服务，开了一个全网的默认端口，一开始以为这台服务器没有公网ip，结果发现之后悔之莫及啊某天发现cpu load高的出奇，发现一个minerd进程占了大量cpu，googl
基于php编程规范(详解)
今天写这个是为了提醒自己编程过程不仅要有逻辑思想还有要规范代码这样可读性 1、PHP 编程规范与编码习惯最主要的有以下几点： 1 文件说明 2 funct
使用yum查看工具lspci所在包并安装的方法(详解)
摘要：虚拟机安装时一般都采用最小化安装，默认没有lspci工具。一台测试虚拟网卡性能的虚拟机，需要lspci工具来查看网卡的类型。本文描述了在一个虚拟机中安装lspci工具的具体步骤。由于要测试
Linux下高并发socket最大连接数所受的各种限制(详解)
1、修改用户进程可打开文件数限制在Linux平台上，无论编写客户端程序还是服务端程序，在进行高并发TCP连接处理时，最高的并发数量都要受到系统对用户单一进程同时可打开文件数量的限制(这是因为系统
一篇文章带你入门java运算符(详解)
目录算术运算符基本四则运算符增量赋值运算符自增/自减运算符关系运算符逻
PHP面向对象之事务脚本模式(详解)
如下所示： ? 1
详解 MapperScannerConfigurer之sqlSessionFactory注入方式
MapperScannerConfigurer之sqlSessionFactory注入方式讲解首先，Mybatis中的有一段配置非常方便，省去我们去写DaoImpl（Dao层实现类）的时间，这个
详解：Linux网络虚拟化技术
Linux的网络虚拟化是LXC项目中的一个子项目，LXC包括文件系统虚拟化，进程空间虚拟化，用户虚拟化，网络虚拟化，等等，这里使用LXC的网络虚拟化来模拟多个网络环境。本文从基本的网络设备讲
highchart数据源纵轴json内的值必须是int(详解)
? 1

qq735679552

个人简介

我是一名优秀的程序员,十分优秀！

作者热门文章

滴滴打车优惠券免费领取

全站热门文章

首页

博学

6Ren·AI

商城

Python利用ElementTree模块处理XML的方法详解