（十五）xml模块

xml是实现不同语言或程序之间进行数据交换的协议，跟json差不多，但json使用起来更简单，不过在json还没诞生的黑暗年代，大家只能选择用xml呀，至今很多传统公司如金融行业的很多系统的接口还主要是xml。

xml的格式如下，就是通过<>节点来区别数据结构的:

<?xml version="1.0"?>

<data>                                           #父标签data

    <country name="china">                       #子标签country   属性name="china"

        <rank updated="yes">2</rank>             #子子标签rank    属性update="yes"   内容2

        <year>2018</year>

    </country>

</data>

xml协议在各个语言里的都是支持的，在python中可以用以下模块操作xml：

import xml.etree.ElementTree as et                #xml模板应该是最长的的模板了，可以用as简写为et（自定义）

tree = et.parse('xml_lesson.xml')                 #用parse()方法来解析xml文件，拿到tree这个对象

root = tree.getroot()                             #getroot()拿到根节点

print(root.tag)                                   #根节点的标签：data

for i in root:                                    #遍历一级子节点，即<country name='china'>

    print(i.tag)                                  #子节点的标签：country

    print(i.attrib)                               #子节点的属性：{'name': 'china'}

    print(i.text)                                 #子节点的内容：无，但实际上是一行空行，注意看下面的结果

    for j in i:                                   #遍历二级子节点，即<rank updated="yes">2</rank>和<year>2018</year>

        print(j.tag)                              #rank、year

        print(j.attrib)                           #{'updated': 'yes'}、{}

        print(j.text)                             #2、2018
结果：

data
country
{'name': 'china'}

rank
{'updated': 'yes'}
2
year
{}
2018

也可以通过直接找节点的方式遍历：

import xml.etree.ElementTree as et

tree = et.parse('xml_lesson.xml')

root = tree.getroot()

for node in root.iter('rank'):              #通过root.iter()方法直接找节点的标签，无论是第几层的节点都可找到，有几个找几个

    print(node.tag,node.attrib,node.text)

结果：rank {'updated': 'yes'} 2

修改节点的操作：

import xml.etree.ElementTree as et

tree = et.parse('xml_lesson.xml')

root = tree.getroot()

for node in root.iter('year'):

    new_year = int(node.text) + 1     #node.text为字符串，需要转为int

    node.text = str(new_year)         #修改year节点的内容，需要转为str

    node.set('update','no')           #修改year节点属性，用set()方法

tree.write('xml_lesson.xml')          #最后需要写入，这里其实是新建一个文件，如果文件名和之前相同，那就是覆盖
结果：xml_lesson.xml变为：

<data>
    <country name="china">
        <rank updated="yes">2</rank>
        <year update="no">2019</year>
    </country>
</data>

删除节点的操作：

xml_lesson.xml为：

<data>

    <country name="china">

        <rank updated="yes">2</rank>

        <year update="no">2019</year>

    </country>

    <country name="India">

        <rank updated="yes">47</rank>

        <year update="no">2019</year>

    </country>

</data>

需求：把排名高于10的国家删除

import xml.etree.ElementTree as et

tree = et.parse('xml_lesson.xml')

root = tree.getroot()

for country in root.findall('country'):        #findall()找到所有country节点

    rank = int(country.find('rank').text)      #在每一个country节点下面，find()找到rank节点

    if rank > 10:

        root.remove(country)                   #root.remove()删除country节点，注意不是删除rank节点

tree.write('abc.xml')

另一种写法：

for country in root.iter('country'):

    for rank in country.iter('rank'):

    # rank = int(country.find('rank').text)

        if int(rank.text) > 10:

            root.remove(country)

tree.write('222.xml')

最后，创建xml文档：

import xml.etree.ElementTree as ET

new_xml = ET.Element("namelist")                                     #生成根节点，tag为namelist

name = ET.SubElement(new_xml, "name", attrib={"enrolled": "yes"})    #生成一级子节点，第一个参数是上一级节点，tag为name，有一个属性

age = ET.SubElement(name, "age", attrib={"checked": "no"})           #生产二级子节点，第一个参数是上一级节点，tag是age，有一个属性

sex = ET.SubElement(name, "sex")

sex.text = '33'                                                      #二级子节点的内容为'33'

name2 = ET.SubElement(new_xml, "name", attrib={"enrolled": "no"})

age = ET.SubElement(name2, "age")

age.text = '19'

et = ET.ElementTree(new_xml)                                         # 生成文档对象

et.write("test.xml", encoding="utf-8", xml_declaration=True)         #写入

结果生成的test.xml文件：

<?xml version='1.0' encoding='utf-8'?>

<namelist>

    <name enrolled="yes">

        <age checked="no" />

        <sex>33</sex>

    </name>

    <name enrolled="no">

        <age>19</age>

    </name>

</namelist>

（十五）xml模块的更多相关文章

python学习第四十九天XML模块的用法
xml是实现不通语言或程序之间进行数据交换的协议,跟json差不多,但是json用起来简单,还没诞生json,以前都是用xml,下面讲述XML模块的用法. 1,导入xml模块 import xml 2 ...
day15 十五、模块、from导入、起别名
一.模块的概念 1.什么是模块:一系列功能的集合体 2.定义模块:创建一个py文件就是一个模块,该py文件名就是模块名模块的四种存在方式使用python编写的.py文件包:一堆py文件的集合体 ...
Python学习日记(十五) collections模块
在内置函数(dict.list.set.tuple)的基础上,collections模块还提供了几个其他的数据类型:Counter.deque.defaultdict.namedtuple和Order ...
孤荷凌寒自学python第三十五天python的文件操作之针对文件操作的os模块的相关内容
孤荷凌寒自学python第三十五天python的文件操作之针对文件操作的os模块的相关内容 (完整学习过程屏幕记录视频地址在文末,手写笔记在文末) 一.打开文件后,要务必记得关闭,所以一般的写法应当 ...
Python第十五天 datetime模块 time模块 thread模块 threading模块 Queue队列模块 multiprocessing模块 paramiko模块 fabric模块
Python第十五天 datetime模块 time模块 thread模块 threading模块 Queue队列模块 multiprocessing模块 paramiko模块 fab ...
day20 二十、加密模块、操作配置文件、操作shell命令、xml模块
一.加密模块 1.hashlib模块:加密 ①有解密的加密方式 ②无解密的加密方式:碰撞检查 -- 1)不同数据加密后的结果一定不一致 -- 2)相同数据的加密结果一定是一致的 import hash ...
二十五. Python基础(25)--模块和包
二十五. Python基础(25)--模块和包 ● 知识框架 ● 模块的属性__name__ # my_module.py def fun1(): print("Hello& ...
第三百二十五节，web爬虫，scrapy模块标签选择器下载图片，以及正则匹配标签
第三百二十五节,web爬虫,scrapy模块标签选择器下载图片,以及正则匹配标签标签选择器对象 HtmlXPathSelector()创建标签选择器对象,参数接收response回调的html对象需 ...
孤荷凌寒自学python第二十五天初识python的time模块
孤荷凌寒自学python第二十五天python的time模块 (完整学习过程屏幕记录视频地址在文末,手写笔记在文末) 通过对time模块添加引用,就可以使用python的time模块来进行相关的时间操 ...
第十五章、线程之queue模块的各种队列
目录第十五章.线程之queue模块的各种队列一.Queue 二.LifoQueue堆栈三.PriorityQueue优先级队列第十五章.线程之queue模块的各种队列一.Queue impo ...

随机推荐

sqli-labs less38-53(堆叠注入 order by之后相关注入)
堆叠注入 less-38 less-39 less-40 less-41 less-42 less-43 less-44 less-45 考察order by相关注入 less-46 less-47 ...
Consul集成Envoy实践
单节点Consul集成Envoy进行安全服务通信前言 Consul Service Mesh通过授权和加密来保护服务之间的通信,还可以拦截有关服务到服务通信的数据并将其呈现给监视工具.我们可以使 ...
Python SQLALchemy框架
SQLALchemy SQLALchemy是Python中的一款优秀的ORM框架,它可以作用于任何第三方Web框架,如flask,tornado等框架. SQLALchemy相较于DjangoORM来 ...
本科入行可能吗？做到这3点，斩获BAT offer不是梦
大家好,前两天有一个小伙伴加我微信咨询.他说他不想读研,想要直接本科毕业就参与工作.但是又担心自己由于没有学历优势,无法在校招当中获得机会,于是便来向我请教,能不能指点迷津提供一些具体的实操性措施.与 ...
云原生时代，Java的危与机（周志明）
说明本篇文章是转载自周志明老师的文章,链接地址:https://www.infoq.cn/article/RQfWw2R2ZpYQiOlc1WBE 今天,25 岁的 Java 仍然是最具有统治力的编 ...
Python之word文档替换字符串（也可以用于短模板套用）
Python之word文档替换字符串(也可以用于短模板套用),代码如下: 1 ''' 2 #word模板套用1:创建模板,适合比较短的文档 3 ''' 4 5 #导入所需库 6 from docx i ...
简单谈谈contextlib的使用
简单谈谈contextlib的使用写在前面做这件事的原因: 在看书的时候,我发现了有大佬们用contextlib管理上下文,真的很牛皮,但是百度了以下,每个大佬都写了很多很全很深刻,讲道理五花八门 ...
小马哥讲Spring栈核心编程思想 Spring IoC+Bean+Framework
小马哥出手的Spring栈核心编程思想课程,可以说是非常专业和权威的Spring课程.课程主要的方向与核心是Spring Framework总览,带领同学们重新认识重新认识IoC,Spring IoC ...
spring的事物传递
Propagation.REQUIRED:默认也是常用的事物级别,在当前事物中执行,不存在事物,则创建新事物执行. Propagation.SUPPORTS:支持使用当前事物,当前事物不存爱,则不使用 ...
Tomcat启动web项目静态页面中文乱码问题解决
1 首先查看静态页面在编辑器中是否正常, 如果是eclipse ,需要设置一下项目编码格式为utf-8, 如果是idea , 一般会自动识别, 也可以自己手动检查一下, 检查html上面是否有 ...

（十五）xml模块

（十五）xml模块的更多相关文章

随机推荐

热门专题