xml中俩种解析方式
两种解析方式

1、from xml.etree import ElementTree as ET
利用ElementTree模块下的xml方法可以把一个字符串类型的东西转换成Element类,从而利用Element类下面的方法
xml(字符串)解析方式只能读不能写
from xml.etree import ElementTree as ET # 打开文件,读取XML内容
str_xml = open('xo.xml', 'r').read() # 将字符串解析成xml特殊对象,root代指xml文件的根节点
root = ET.XML(str_xml)
from xml.etree import ElementTree as ET
a=open("first_xml","r",encoding="utf-8").read()
print(type(a))
b=ET.XML(a) 其中b为根节点 #利用xml方法可以的到一个Element类
print(type(b)) <class 'str'> 输入一个字符串类型的转成Element类
<class 'xml.etree.ElementTree.Element'>
def XML(text, parser=None):
"""Parse XML document from string constant. This function can be used to embed "XML Literals" in Python code. *text* is a string containing XML data, *parser* is an
optional parser instance, defaulting to the standard XMLParser. Returns an Element instance.
Element下面的方法:
1、 iter(所查看的东西)返回所匹配到的元素的迭代器 用于找到某一类节点并去循环
Return an iterator containing all the matching elements.
2、 tag 返回节点的标签名
3、 attrib 返回标签的属性
4、 find()找到第一个匹配到的对象并返回 只能找儿子不能找孙子
5、 txet 获取标签的内容
2、parse(文件名)打开文件并解析,相比于xml少了打开文件那一步
from xml.etree import ElementTree as ET # 直接解析xml文件
tree = ET.parse("xo.xml") # 获取xml文件的根节点
root = tree.getroot() 通过getroot获取根节点
from xml.etree import ElementTree as ET
a=ET.parse("first_xml") #解析成ElementTree类的对象
b=a.getroot() #转换成Element类的对象
print(a.getroot(),type(a)) <Element 'data' at 0x00000033D062F958> <class 'xml.etree.ElementTree.ElementTree'>
def parse(source, parser=None):
"""Parse XML document into element tree. *source* is a filename or file object containing XML data,
*parser* is an optional parser instance defaulting to XMLParser. Return an ElementTree instance. """
tree = ElementTree()
tree.parse(source, parser)
return tree
ElementTree下面的方法:
1、 getroot() 获取xml文件的根节点 与xml不同(通过xml()直接获取根节点,而parse()还的再通过getroot获取根节点)
2、 根节点.tag 获取节点的标签(这里与xml不同的是先利用getroot()得到根节点再tag)
3、 根节点.attrib 获取节点的属性(原理同上)
4、 text 获取标签的内容
5、 a.write(文件名)写入文件
from xml.etree import ElementTree as ET
a=ET.parse("first_xml")
b=a.getroot()
for i in b.iter("year"):
new_year=int(i.text)+1
i.text=str(new_year)
a.write("first_xml")
6、 标签名.set("k1","k2") 为标签添加属性
7、 del 标签名 attrib["k1"] 删除标签的属性,如果标签名无属性,删除报错
3、创建一个XML文档
方法1
from xml.etree import ElementTree as ET
a=ET.Element("aaa") #创建根节点
b=ET.Element("bbb",{"k1":"k2"}) #创建子节点
c=ET.Element("ccc",{"k2":"k3"})
d=ET.Element("ddd",{"k3":"k4"}) a.append(b)
b.append(c)
c.append(d)
#生成文档对象
et = ET.ElementTree(a) *******#生成文档对象********
et.write("test.xml", encoding="utf-8", xml_declaration=True, short_empty_elements=False)
方法2
from xml.etree import ElementTree as ET # 创建根节点
root = ET.Element("famliy") # 创建大儿子
# son1 = ET.Element('son', {'name': '儿1'})
son1 = root.makeelement('son', {'name': '儿1'})
# 创建小儿子
# son2 = ET.Element('son', {"name": '儿2'})
son2 = root.makeelement('son', {"name": '儿2'}) # 在大儿子中创建两个孙子
# grandson1 = ET.Element('grandson', {'name': '儿11'})
grandson1 = son1.makeelement('grandson', {'name': '儿11'})
# grandson2 = ET.Element('grandson', {'name': '儿12'})
grandson2 = son1.makeelement('grandson', {'name': '儿12'}) son1.append(grandson1)
son1.append(grandson2) # 把儿子添加到根节点中
root.append(son1)
root.append(son1)
#生成文档对象
tree = ET.ElementTree(root)
tree.write('oooo.xml',encoding='utf-8', short_empty_elements=False)
方法3
from xml.etree import ElementTree as f
# 创建根节点
a=f.Element("QWE")
# 创建儿子
b=f.SubElement(a,"asd",{"k1":"v1"})
# 创建孙子
c=f.SubElement(b,"fgh",{"k2":"v2"})
#生成文档对象
z=f.ElementTree(a)
z.write("ad.xml",encoding="utf-8")
控制节点自闭合
short_empty_elements=False
加上节点不能自闭合 <grandson name="儿12"></grandson>
不加自闭合 <grandson name="儿12" />
注释
xml_declaration=True
加上使xml文件有注释 <?xml version='1.0' encoding='utf-8'?>
由于原生保存的XML时默认无缩进,如果想要设置缩进的话, 需要修改保存方式:
from xml.etree import ElementTree as ET
from xml.dom import minidom def prettify(elem):
"""将节点转换成字符串,并添加缩进。
"""
rough_string = ET.tostring(elem, 'utf-8')
reparsed = minidom.parseString(rough_string)
return reparsed.toprettyxml(indent="\t") # 创建根节点
root = ET.Element("famliy") # 创建大儿子
# son1 = ET.Element('son', {'name': '儿1'})
son1 = root.makeelement('son', {'name': '儿1'})
# 创建小儿子
# son2 = ET.Element('son', {"name": '儿2'})
son2 = root.makeelement('son', {"name": '儿2'}) # 在大儿子中创建两个孙子
# grandson1 = ET.Element('grandson', {'name': '儿11'})
grandson1 = son1.makeelement('grandson', {'name': '儿11'})
# grandson2 = ET.Element('grandson', {'name': '儿12'})
grandson2 = son1.makeelement('grandson', {'name': '儿12'}) son1.append(grandson1)
son1.append(grandson2) # 把儿子添加到根节点中
root.append(son1)
root.append(son1) raw_str = prettify(root) f = open("xxxoo.xml",'w',encoding='utf-8')
f.write(raw_str)
f.close()
自己写的
from xml.etree import ElementTree as f
from xml.dom import minidom
def prettify(elem):
"""将节点转换成字符串,并添加缩进。
"""
rough_string = f.tostring(elem, 'utf-8')
reparsed = minidom.parseString(rough_string)
return reparsed.toprettyxml(indent="\t")
a=f.Element("QWE")
b=a.makeelement("asd",{"K1":"V2"})
c=a.makeelement("zxc",{"K1":"V2"})
a.set("name","lu")
a.append(b)
b.append(c)
z=prettify(a) #转成字符串了直接写入
s=open("xxxx.xml","w")
s.write(z)
s.close()
xml中俩种解析方式的更多相关文章
- Android平台中实现对XML的三种解析方式
本文介绍在Android平台中实现对XML的三种解析方式. XML在各种开发中都广泛应用,Android也不例外.作为承载数据的一个重要角色,如何读写XML成为Android开发中一项重要的技能. 在 ...
- xml常用四种解析方式优缺点的分析×××××
xml常用四种解析方式优缺点的分析 博客分类: xml 最近用得到xml的解析方式,于是就翻了翻自己的笔记同时从网上查找了资料,自己在前人的基础上总结了下,贴出来大家分享下. 首先介绍一下xml语 ...
- XML 的4种解析方式
在上一篇博客中,我们介绍了什么是 XML ,http://www.cnblogs.com/ysocean/p/6901008.html,那么这一篇博客我们介绍如何来解析 XML . 部分文档引用:ht ...
- Web.xml中四种验证方式
源地址:https://blog.csdn.net/imimi_/article/details/78805642 <security-constraint> 的子元素 <http- ...
- XML解析——Java中XML的四种解析方式
XML是一种通用的数据交换格式,它的平台无关性.语言无关性.系统无关性.给数据集成与交互带来了极大的方便.XML在不同的语言环境中解析方式都是一样的,只不过实现的语法不同而已. XML的解析方式分为四 ...
- XML解析——Java中XML的四种解析方式(转载 by 龍清扬)
XML是一种通用的数据交换格式,它的平台无关性.语言无关性.系统无关性.给数据集成与交互带来了极大的方便.XML在不同的语言环境中解析方式都是一样的,只不过实现的语法不同而已. XML的解析方式分为四 ...
- Java中XML的四种解析方式(二)
三.JDOM解析 特征: 1.仅使用具体类,而不使用接口. 2.API大量使用了Collections类. import org.jdom2.Attribute; import org.jdom2.D ...
- Java中XML的四种解析方式(一)
XML是一种通用的数据交换格式,它的平台无关性.语言无关性.系统无关性给数据集成与交互带来了极大的方便.XML在不同的语言环境中解析的方式都是一样的,只不过实现的语法不同而已. XML文档以层级标签的 ...
- XML的两种解析方式
JDK提供的XML解析方式分为两种:DOM方式和SAX方式DOM:Document Object Model.需要读取整个XML文档,先需要在内存中构架代表整个DOM树的Document对象,可以进行 ...
随机推荐
- bzoj4716 假摔
Description [题目背景] 小Q最近喜欢上了一款游戏,名为<舰队connection>,在游戏中,小Q指挥强大的舰队南征北战,从而成为了一名 dalao.在游戏关卡的攻略中,可能 ...
- Saltstack系列6:Saltstack之state
state功能 state是Saltstack最核心的功能,通过预先定制好的sls(salt state file)文件对被控制主机进行状态管理,支持包括程序包(pkg).文件(file).网络配置( ...
- oracle 10G以上版本 树形查询新加的几个功能
1.判断当前节点是否叶子节点 在 Oracle 10g 中,还有其他更多关于层次查询的新特性 .例如,有的时候用户更关心的是每个层次分支中等级最低的内容.那么你就可以利用伪列函数CONNECT_BY_ ...
- 黄聪:如何使用WebKitBrowser调用元素点击事件(C#)
string s = "var _elm = document.getElementById('loginBtn');var _evt = document.createEvent('Mou ...
- linux网络不同的解决办法
贯标防火墙,iptables 注释掉/etc/hosts的localhost的ipv6地址映射
- 最最简单的~WordCount¬
sc.textFile("hdfs://....").flatMap(line =>line.split(" ")).map(w =>(w,1)). ...
- 张恭庆编《泛函分析讲义》第二章第2节 $Riesz$ 定理及其应用习题解答
在本节中, $\scrH$ 均指 $Hilbert$ 空间. 1.在极大闭子空间的交的最佳逼近元 设 $f_1,f_2,\cdots,f_n$ 是 $\scrH$ 上的一组线性有界泛函, $$\bex ...
- pedagogical
在线考试 // '+this+''; }); //alert(错了); $("#ans").html(html); } function clk(obj){ var inp ...
- setInterval()和setTimeout()的区别
一.setInterval()函数的语法结构: setInterval(code,interval) setInterval()函数可周期性执行一段代码,也就是说代码会被周期性不断的执行下去. 函数具 ...
- 里德九步审讯法 z
在现实生活中,警方审讯靠的不仅仅是自信和创造力(尽管这两点对审讯工作确有帮助)——审讯者还要在交际影响的心理战术方面接受过高水平训练. 让一个人认罪可不是件容易事,而警察有时能让无辜者承认 ...