xml中俩种解析方式

两种解析方式

1、from xml.etree import ElementTree as ET

利用ElementTree模块下的xml方法可以把一个字符串类型的东西转换成Element类，从而利用Element类下面的方法

xml（字符串）解析方式只能读不能写

from xml.etree import ElementTree as ET

# 打开文件，读取XML内容

str_xml = open('xo.xml', 'r').read()

# 将字符串解析成xml特殊对象，root代指xml文件的根节点

root = ET.XML(str_xml)

from xml.etree import ElementTree as ET

a=open("first_xml","r",encoding="utf-8").read()

print(type(a))

b=ET.XML(a)            　　　　　　其中b为根节点　　　　　　　　                        #利用xml方法可以的到一个Element类

print(type(b))

<class 'str'>　　　　　　　　　　　　　　　　　　　　输入一个字符串类型的转成Element类
<class 'xml.etree.ElementTree.Element'>

def XML(text, parser=None):

    """Parse XML document from string constant.

    This function can be used to embed "XML Literals" in Python code.

    *text* is a string containing XML data, *parser* is an

    optional parser instance, defaulting to the standard XMLParser.

    Returns an Element instance.

Element下面的方法：

1、　　iter（所查看的东西）返回所匹配到的元素的迭代器用于找到某一类节点并去循环

　　Return an iterator containing all the matching elements.

2、　 tag 返回节点的标签名

3、　 attrib 返回标签的属性

4、　 find（）找到第一个匹配到的对象并返回只能找儿子不能找孙子

5、 txet 获取标签的内容

2、parse（文件名）打开文件并解析，相比于xml少了打开文件那一步

from xml.etree import ElementTree as ET

# 直接解析xml文件

tree = ET.parse("xo.xml")

# 获取xml文件的根节点

root = tree.getroot()　　　　　　通过getroot获取根节点

from xml.etree import ElementTree as ET

a=ET.parse("first_xml")　　　　　　　　　　#解析成ElementTree类的对象
b=a.getroot()　　　　　　　　　　　　　　　　#转换成Element类的对象

print(a.getroot(),type(a))                    

<Element 'data' at 0x00000033D062F958> <class 'xml.etree.ElementTree.ElementTree'>

def parse(source, parser=None):

    """Parse XML document into element tree.

    *source* is a filename or file object containing XML data,

    *parser* is an optional parser instance defaulting to XMLParser.

    Return an ElementTree instance.

    """

    tree = ElementTree()

    tree.parse(source, parser)

    return tree

ElementTree下面的方法：

1、　　getroot（）获取xml文件的根节点与xml不同（通过xml（）直接获取根节点，而parse（）还的再通过getroot获取根节点）

2、　　根节点.tag 获取节点的标签（这里与xml不同的是先利用getroot（）得到根节点再tag）

3、　　根节点.attrib 获取节点的属性（原理同上）

4、　　text 获取标签的内容

5、　　a.write（文件名）写入文件

from xml.etree import ElementTree as ET

a=ET.parse("first_xml")

b=a.getroot()

for i in b.iter("year"):

    new_year=int(i.text)+1

    i.text=str(new_year)

a.write("first_xml")

6、　　标签名.set("k1","k2") 为标签添加属性

7、　　del 标签名 attrib["k1"]　删除标签的属性，如果标签名无属性，删除报错

3、创建一个XML文档

方法1

from xml.etree import ElementTree as ET

a=ET.Element("aaa")                 #创建根节点

b=ET.Element("bbb",{"k1":"k2"})    #创建子节点

c=ET.Element("ccc",{"k2":"k3"})

d=ET.Element("ddd",{"k3":"k4"})

a.append(b)

b.append(c)

c.append(d)
  #生成文档对象

et = ET.ElementTree(a)      *******#生成文档对象********

et.write("test.xml", encoding="utf-8", xml_declaration=True, short_empty_elements=False)

方法2

from xml.etree import ElementTree as ET

# 创建根节点

root = ET.Element("famliy")

# 创建大儿子

# son1 = ET.Element('son', {'name': '儿1'})

son1 = root.makeelement('son', {'name': '儿1'})

# 创建小儿子

# son2 = ET.Element('son', {"name": '儿2'})

son2 = root.makeelement('son', {"name": '儿2'})

# 在大儿子中创建两个孙子

# grandson1 = ET.Element('grandson', {'name': '儿11'})

grandson1 = son1.makeelement('grandson', {'name': '儿11'})

# grandson2 = ET.Element('grandson', {'name': '儿12'})

grandson2 = son1.makeelement('grandson', {'name': '儿12'})

son1.append(grandson1)

son1.append(grandson2)

# 把儿子添加到根节点中

root.append(son1)

root.append(son1)

  #生成文档对象

tree = ET.ElementTree(root)

tree.write('oooo.xml',encoding='utf-8', short_empty_elements=False)

方法3

from xml.etree import ElementTree as f
# 创建根节点

a=f.Element("QWE")
# 创建儿子

b=f.SubElement(a,"asd",{"k1":"v1"})
# 创建孙子

c=f.SubElement(b,"fgh",{"k2":"v2"})
  #生成文档对象

z=f.ElementTree(a)

z.write("ad.xml",encoding="utf-8")

控制节点自闭合

short_empty_elements=False

加上节点不能自闭合 <grandson name="儿12"></grandson>

不加自闭合 <grandson name="儿12" />

注释

xml_declaration=True

加上使xml文件有注释　　<?xml version='1.0' encoding='utf-8'?>

由于原生保存的XML时默认无缩进，如果想要设置缩进的话，需要修改保存方式：

from xml.etree import ElementTree as ET

from xml.dom import minidom

def prettify(elem):

    """将节点转换成字符串，并添加缩进。

    """

    rough_string = ET.tostring(elem, 'utf-8')

    reparsed = minidom.parseString(rough_string)

    return reparsed.toprettyxml(indent="\t")

# 创建根节点

root = ET.Element("famliy")

# 创建大儿子

# son1 = ET.Element('son', {'name': '儿1'})

son1 = root.makeelement('son', {'name': '儿1'})

# 创建小儿子

# son2 = ET.Element('son', {"name": '儿2'})

son2 = root.makeelement('son', {"name": '儿2'})

# 在大儿子中创建两个孙子

# grandson1 = ET.Element('grandson', {'name': '儿11'})

grandson1 = son1.makeelement('grandson', {'name': '儿11'})

# grandson2 = ET.Element('grandson', {'name': '儿12'})

grandson2 = son1.makeelement('grandson', {'name': '儿12'})

son1.append(grandson1)

son1.append(grandson2)

# 把儿子添加到根节点中

root.append(son1)

root.append(son1)

raw_str = prettify(root)

f = open("xxxoo.xml",'w',encoding='utf-8')

f.write(raw_str)

f.close()

自己写的

from xml.etree import ElementTree as f

from xml.dom import minidom

def prettify(elem):

    """将节点转换成字符串，并添加缩进。

    """

    rough_string = f.tostring(elem, 'utf-8')

    reparsed = minidom.parseString(rough_string)

    return reparsed.toprettyxml(indent="\t")

a=f.Element("QWE")

b=a.makeelement("asd",{"K1":"V2"})

c=a.makeelement("zxc",{"K1":"V2"})

a.set("name","lu")

a.append(b)

b.append(c)

z=prettify(a)       #转成字符串了直接写入

s=open("xxxx.xml","w")

s.write(z)

s.close()

xml中俩种解析方式的更多相关文章

Android平台中实现对XML的三种解析方式
本文介绍在Android平台中实现对XML的三种解析方式. XML在各种开发中都广泛应用,Android也不例外.作为承载数据的一个重要角色,如何读写XML成为Android开发中一项重要的技能. 在 ...
xml常用四种解析方式优缺点的分析×××××
xml常用四种解析方式优缺点的分析博客分类: xml 最近用得到xml的解析方式,于是就翻了翻自己的笔记同时从网上查找了资料,自己在前人的基础上总结了下,贴出来大家分享下. 首先介绍一下xml语 ...
XML 的4种解析方式
在上一篇博客中,我们介绍了什么是 XML ,http://www.cnblogs.com/ysocean/p/6901008.html,那么这一篇博客我们介绍如何来解析 XML . 部分文档引用:ht ...
Web.xml中四种验证方式
源地址:https://blog.csdn.net/imimi_/article/details/78805642 <security-constraint> 的子元素 <http- ...
XML解析——Java中XML的四种解析方式
XML是一种通用的数据交换格式,它的平台无关性.语言无关性.系统无关性.给数据集成与交互带来了极大的方便.XML在不同的语言环境中解析方式都是一样的,只不过实现的语法不同而已. XML的解析方式分为四 ...
XML解析——Java中XML的四种解析方式（转载 by 龍清扬）
XML是一种通用的数据交换格式,它的平台无关性.语言无关性.系统无关性.给数据集成与交互带来了极大的方便.XML在不同的语言环境中解析方式都是一样的,只不过实现的语法不同而已. XML的解析方式分为四 ...
Java中XML的四种解析方式（二）
三.JDOM解析特征: 1.仅使用具体类,而不使用接口. 2.API大量使用了Collections类. import org.jdom2.Attribute; import org.jdom2.D ...
Java中XML的四种解析方式（一）
XML是一种通用的数据交换格式,它的平台无关性.语言无关性.系统无关性给数据集成与交互带来了极大的方便.XML在不同的语言环境中解析的方式都是一样的,只不过实现的语法不同而已. XML文档以层级标签的 ...
XML的两种解析方式
JDK提供的XML解析方式分为两种:DOM方式和SAX方式DOM:Document Object Model.需要读取整个XML文档,先需要在内存中构架代表整个DOM树的Document对象,可以进行 ...

随机推荐

bzoj4716 假摔
Description [题目背景] 小Q最近喜欢上了一款游戏,名为<舰队connection>,在游戏中,小Q指挥强大的舰队南征北战,从而成为了一名 dalao.在游戏关卡的攻略中,可能 ...
Saltstack系列6：Saltstack之state
state功能 state是Saltstack最核心的功能,通过预先定制好的sls(salt state file)文件对被控制主机进行状态管理,支持包括程序包(pkg).文件(file).网络配置( ...
oracle 10G以上版本树形查询新加的几个功能
1.判断当前节点是否叶子节点在 Oracle 10g 中,还有其他更多关于层次查询的新特性 .例如,有的时候用户更关心的是每个层次分支中等级最低的内容.那么你就可以利用伪列函数CONNECT_BY_ ...
黄聪：如何使用WebKitBrowser调用元素点击事件（C#）
string s = "var _elm = document.getElementById('loginBtn');var _evt = document.createEvent('Mou ...
linux网络不同的解决办法
贯标防火墙,iptables 注释掉/etc/hosts的localhost的ipv6地址映射
最最简单的~WordCount¬
sc.textFile("hdfs://....").flatMap(line =>line.split(" ")).map(w =>(w,1)). ...
张恭庆编《泛函分析讲义》第二章第2节 $Riesz$ 定理及其应用习题解答
在本节中, $\scrH$ 均指 $Hilbert$ 空间. 1.在极大闭子空间的交的最佳逼近元设 $f_1,f_2,\cdots,f_n$ 是 $\scrH$ 上的一组线性有界泛函, $$\bex ...
pedagogical
在线考试 // '+this+''; }); //alert(错了); $("#ans").html(html); } function clk(obj){ var inp ...
setInterval()和setTimeout()的区别
一.setInterval()函数的语法结构: setInterval(code,interval) setInterval()函数可周期性执行一段代码,也就是说代码会被周期性不断的执行下去. 函数具 ...
里德九步审讯法 z
在现实生活中,警方审讯靠的不仅仅是自信和创造力(尽管这两点对审讯工作确有帮助)——审讯者还要在交际影响的心理战术方面接受过高水平训练. 让一个人认罪可不是件容易事,而警察有时能让无辜者承认 ...

xml中俩种解析方式

xml中俩种解析方式的更多相关文章

随机推荐

热门专题