（十五）xml模块

xml是实现不同语言或程序之间进行数据交换的协议，跟json差不多，但json使用起来更简单，不过在json还没诞生的黑暗年代，大家只能选择用xml呀，至今很多传统公司如金融行业的很多系统的接口还主要是xml。

xml的格式如下，就是通过<>节点来区别数据结构的:

<?xml version="1.0"?>

<data>                                           #父标签data

    <country name="china">                       #子标签country   属性name="china"

        <rank updated="yes">2</rank>             #子子标签rank    属性update="yes"   内容2

        <year>2018</year>

    </country>

</data>

xml协议在各个语言里的都是支持的，在python中可以用以下模块操作xml：

import xml.etree.ElementTree as et                #xml模板应该是最长的的模板了，可以用as简写为et（自定义）

tree = et.parse('xml_lesson.xml')                 #用parse()方法来解析xml文件，拿到tree这个对象

root = tree.getroot()                             #getroot()拿到根节点

print(root.tag)                                   #根节点的标签：data

for i in root:                                    #遍历一级子节点，即<country name='china'>

    print(i.tag)                                  #子节点的标签：country

    print(i.attrib)                               #子节点的属性：{'name': 'china'}

    print(i.text)                                 #子节点的内容：无，但实际上是一行空行，注意看下面的结果

    for j in i:                                   #遍历二级子节点，即<rank updated="yes">2</rank>和<year>2018</year>

        print(j.tag)                              #rank、year

        print(j.attrib)                           #{'updated': 'yes'}、{}

        print(j.text)                             #2、2018
结果：

data
country
{'name': 'china'}

rank
{'updated': 'yes'}
2
year
{}
2018

也可以通过直接找节点的方式遍历：

import xml.etree.ElementTree as et

tree = et.parse('xml_lesson.xml')

root = tree.getroot()

for node in root.iter('rank'):              #通过root.iter()方法直接找节点的标签，无论是第几层的节点都可找到，有几个找几个

    print(node.tag,node.attrib,node.text)

结果：rank {'updated': 'yes'} 2

修改节点的操作：

import xml.etree.ElementTree as et

tree = et.parse('xml_lesson.xml')

root = tree.getroot()

for node in root.iter('year'):

    new_year = int(node.text) + 1     #node.text为字符串，需要转为int

    node.text = str(new_year)         #修改year节点的内容，需要转为str

    node.set('update','no')           #修改year节点属性，用set()方法

tree.write('xml_lesson.xml')          #最后需要写入，这里其实是新建一个文件，如果文件名和之前相同，那就是覆盖
结果：xml_lesson.xml变为：

<data>
    <country name="china">
        <rank updated="yes">2</rank>
        <year update="no">2019</year>
    </country>
</data>

删除节点的操作：

xml_lesson.xml为：

<data>

    <country name="china">

        <rank updated="yes">2</rank>

        <year update="no">2019</year>

    </country>

    <country name="India">

        <rank updated="yes">47</rank>

        <year update="no">2019</year>

    </country>

</data>

需求：把排名高于10的国家删除

import xml.etree.ElementTree as et

tree = et.parse('xml_lesson.xml')

root = tree.getroot()

for country in root.findall('country'):        #findall()找到所有country节点

    rank = int(country.find('rank').text)      #在每一个country节点下面，find()找到rank节点

    if rank > 10:

        root.remove(country)                   #root.remove()删除country节点，注意不是删除rank节点

tree.write('abc.xml')

另一种写法：

for country in root.iter('country'):

    for rank in country.iter('rank'):

    # rank = int(country.find('rank').text)

        if int(rank.text) > 10:

            root.remove(country)

tree.write('222.xml')

最后，创建xml文档：

import xml.etree.ElementTree as ET

new_xml = ET.Element("namelist")                                     #生成根节点，tag为namelist

name = ET.SubElement(new_xml, "name", attrib={"enrolled": "yes"})    #生成一级子节点，第一个参数是上一级节点，tag为name，有一个属性

age = ET.SubElement(name, "age", attrib={"checked": "no"})           #生产二级子节点，第一个参数是上一级节点，tag是age，有一个属性

sex = ET.SubElement(name, "sex")

sex.text = '33'                                                      #二级子节点的内容为'33'

name2 = ET.SubElement(new_xml, "name", attrib={"enrolled": "no"})

age = ET.SubElement(name2, "age")

age.text = '19'

et = ET.ElementTree(new_xml)                                         # 生成文档对象

et.write("test.xml", encoding="utf-8", xml_declaration=True)         #写入

结果生成的test.xml文件：

<?xml version='1.0' encoding='utf-8'?>

<namelist>

    <name enrolled="yes">

        <age checked="no" />

        <sex>33</sex>

    </name>

    <name enrolled="no">

        <age>19</age>

    </name>

</namelist>

（十五）xml模块的更多相关文章

python学习第四十九天XML模块的用法
xml是实现不通语言或程序之间进行数据交换的协议,跟json差不多,但是json用起来简单,还没诞生json,以前都是用xml,下面讲述XML模块的用法. 1,导入xml模块 import xml 2 ...
day15 十五、模块、from导入、起别名
一.模块的概念 1.什么是模块:一系列功能的集合体 2.定义模块:创建一个py文件就是一个模块,该py文件名就是模块名模块的四种存在方式使用python编写的.py文件包:一堆py文件的集合体 ...
Python学习日记(十五) collections模块
在内置函数(dict.list.set.tuple)的基础上,collections模块还提供了几个其他的数据类型:Counter.deque.defaultdict.namedtuple和Order ...
孤荷凌寒自学python第三十五天python的文件操作之针对文件操作的os模块的相关内容
孤荷凌寒自学python第三十五天python的文件操作之针对文件操作的os模块的相关内容 (完整学习过程屏幕记录视频地址在文末,手写笔记在文末) 一.打开文件后,要务必记得关闭,所以一般的写法应当 ...
Python第十五天 datetime模块 time模块 thread模块 threading模块 Queue队列模块 multiprocessing模块 paramiko模块 fabric模块
Python第十五天 datetime模块 time模块 thread模块 threading模块 Queue队列模块 multiprocessing模块 paramiko模块 fab ...
day20 二十、加密模块、操作配置文件、操作shell命令、xml模块
一.加密模块 1.hashlib模块:加密 ①有解密的加密方式 ②无解密的加密方式:碰撞检查 -- 1)不同数据加密后的结果一定不一致 -- 2)相同数据的加密结果一定是一致的 import hash ...
二十五. Python基础(25)--模块和包
二十五. Python基础(25)--模块和包 ● 知识框架 ● 模块的属性__name__ # my_module.py def fun1(): print("Hello& ...
第三百二十五节，web爬虫，scrapy模块标签选择器下载图片，以及正则匹配标签
第三百二十五节,web爬虫,scrapy模块标签选择器下载图片,以及正则匹配标签标签选择器对象 HtmlXPathSelector()创建标签选择器对象,参数接收response回调的html对象需 ...
孤荷凌寒自学python第二十五天初识python的time模块
孤荷凌寒自学python第二十五天python的time模块 (完整学习过程屏幕记录视频地址在文末,手写笔记在文末) 通过对time模块添加引用,就可以使用python的time模块来进行相关的时间操 ...
第十五章、线程之queue模块的各种队列
目录第十五章.线程之queue模块的各种队列一.Queue 二.LifoQueue堆栈三.PriorityQueue优先级队列第十五章.线程之queue模块的各种队列一.Queue impo ...

随机推荐

终于不再对transition和animation,傻傻分不清楚了 --vue中使用transition和animation
以前写页面注重在功能上,对于transition和animation是只闻其声,不见其人,对于页面动画效果心理一直痒痒的.最近做活动页面,要求页面比较酷炫,终于有机会认真了解了. transition ...
【MindSpore】Ubuntu16.04上成功安装GPU版MindSpore1.0.1
本文是在宿主机Ubuntu16.04上拉取cuda10.1-cudnn7-ubuntu18.04的镜像,在容器中通过Miniconda3创建python3.7.5的环境并成功安装mindspore_g ...
20201126-1 txt文件筛选与读写【】
Exercise 1import os # 设置文件夹路径为'工作文件夹',获取文件夹下的所有文件和文件夹名称 path = './工作文件夹/' files_list = os.listdir(pa ...
跨站点脚本编制 - SpringBoot配置XSS过滤器（基于mica-xss）
1. 简介 XSS,即跨站脚本编制,英文为Cross Site Scripting.为了和CSS区分,命名为XSS. XSS是最普遍的Web应用安全漏洞.这类漏洞能够使得攻击者嵌入恶意脚本代码 ...
js 控制输入框保存数字级小数点后一位
$('#Question8').on('keyup', function () { var regVoter = $("#Question8").val(); regVoter = ...
安卓 Android Studio 下载
http://www.android-studio.org/ 下载地址 https://blog.csdn.net/qq_41976613/article/details/91432304 ...
scala安装遇到的问题：[ERROR] Failed to construct terminal; falling back to unsupported java.lang.NumberFormatException: For input string: "0x100"
安装scala时遇到的问题 lion@king:/opt$ scala Welcome to Scala 2.11.12 (Java HotSpot(TM) 64-Bit Server VM, Jav ...
Fabric 配置 order节点问题
问题描述: Error: failed to create deliver client: orderer client failed to connect to orderer.example.co ...
mini-web框架-装饰器-总结1(5.3.1）
@ 目录 1.说明 2.代码关于作者 1.说明原则:开放封闭可以扩展,但是不可以修改.也就是说软件对扩展开放,对修改关闭. 运用技术:闭包一共两种方法,一个使用闭包,一个使用类使用多个装饰器 ...
java_day_02
一.return的两个作用 1.停止当前方法 2.将后面的结果数据返回值还给调用处二.方法的三种调用格式 1.单独调用:方法名(参数): public class Method { public s ...

（十五）xml模块

（十五）xml模块的更多相关文章

随机推荐

热门专题