xml中俩种解析方式

两种解析方式

1、from xml.etree import ElementTree as ET

利用ElementTree模块下的xml方法可以把一个字符串类型的东西转换成Element类，从而利用Element类下面的方法

xml（字符串）解析方式只能读不能写

from xml.etree import ElementTree as ET

# 打开文件，读取XML内容

str_xml = open('xo.xml', 'r').read()

# 将字符串解析成xml特殊对象，root代指xml文件的根节点

root = ET.XML(str_xml)

from xml.etree import ElementTree as ET

a=open("first_xml","r",encoding="utf-8").read()

print(type(a))

b=ET.XML(a)            　　　　　　其中b为根节点　　　　　　　　                        #利用xml方法可以的到一个Element类

print(type(b))

<class 'str'>　　　　　　　　　　　　　　　　　　　　输入一个字符串类型的转成Element类
<class 'xml.etree.ElementTree.Element'>

def XML(text, parser=None):

    """Parse XML document from string constant.

    This function can be used to embed "XML Literals" in Python code.

    *text* is a string containing XML data, *parser* is an

    optional parser instance, defaulting to the standard XMLParser.

    Returns an Element instance.

Element下面的方法：

1、　　iter（所查看的东西）返回所匹配到的元素的迭代器用于找到某一类节点并去循环

　　Return an iterator containing all the matching elements.

2、　 tag 返回节点的标签名

3、　 attrib 返回标签的属性

4、　 find（）找到第一个匹配到的对象并返回只能找儿子不能找孙子

5、 txet 获取标签的内容

2、parse（文件名）打开文件并解析，相比于xml少了打开文件那一步

from xml.etree import ElementTree as ET

# 直接解析xml文件

tree = ET.parse("xo.xml")

# 获取xml文件的根节点

root = tree.getroot()　　　　　　通过getroot获取根节点

from xml.etree import ElementTree as ET

a=ET.parse("first_xml")　　　　　　　　　　#解析成ElementTree类的对象
b=a.getroot()　　　　　　　　　　　　　　　　#转换成Element类的对象

print(a.getroot(),type(a))                    

<Element 'data' at 0x00000033D062F958> <class 'xml.etree.ElementTree.ElementTree'>

def parse(source, parser=None):

    """Parse XML document into element tree.

    *source* is a filename or file object containing XML data,

    *parser* is an optional parser instance defaulting to XMLParser.

    Return an ElementTree instance.

    """

    tree = ElementTree()

    tree.parse(source, parser)

    return tree

ElementTree下面的方法：

1、　　getroot（）获取xml文件的根节点与xml不同（通过xml（）直接获取根节点，而parse（）还的再通过getroot获取根节点）

2、　　根节点.tag 获取节点的标签（这里与xml不同的是先利用getroot（）得到根节点再tag）

3、　　根节点.attrib 获取节点的属性（原理同上）

4、　　text 获取标签的内容

5、　　a.write（文件名）写入文件

from xml.etree import ElementTree as ET

a=ET.parse("first_xml")

b=a.getroot()

for i in b.iter("year"):

    new_year=int(i.text)+1

    i.text=str(new_year)

a.write("first_xml")

6、　　标签名.set("k1","k2") 为标签添加属性

7、　　del 标签名 attrib["k1"]　删除标签的属性，如果标签名无属性，删除报错

3、创建一个XML文档

方法1

from xml.etree import ElementTree as ET

a=ET.Element("aaa")                 #创建根节点

b=ET.Element("bbb",{"k1":"k2"})    #创建子节点

c=ET.Element("ccc",{"k2":"k3"})

d=ET.Element("ddd",{"k3":"k4"})

a.append(b)

b.append(c)

c.append(d)
  #生成文档对象

et = ET.ElementTree(a)      *******#生成文档对象********

et.write("test.xml", encoding="utf-8", xml_declaration=True, short_empty_elements=False)

方法2

from xml.etree import ElementTree as ET

# 创建根节点

root = ET.Element("famliy")

# 创建大儿子

# son1 = ET.Element('son', {'name': '儿1'})

son1 = root.makeelement('son', {'name': '儿1'})

# 创建小儿子

# son2 = ET.Element('son', {"name": '儿2'})

son2 = root.makeelement('son', {"name": '儿2'})

# 在大儿子中创建两个孙子

# grandson1 = ET.Element('grandson', {'name': '儿11'})

grandson1 = son1.makeelement('grandson', {'name': '儿11'})

# grandson2 = ET.Element('grandson', {'name': '儿12'})

grandson2 = son1.makeelement('grandson', {'name': '儿12'})

son1.append(grandson1)

son1.append(grandson2)

# 把儿子添加到根节点中

root.append(son1)

root.append(son1)

  #生成文档对象

tree = ET.ElementTree(root)

tree.write('oooo.xml',encoding='utf-8', short_empty_elements=False)

方法3

from xml.etree import ElementTree as f
# 创建根节点

a=f.Element("QWE")
# 创建儿子

b=f.SubElement(a,"asd",{"k1":"v1"})
# 创建孙子

c=f.SubElement(b,"fgh",{"k2":"v2"})
  #生成文档对象

z=f.ElementTree(a)

z.write("ad.xml",encoding="utf-8")

控制节点自闭合

short_empty_elements=False

加上节点不能自闭合 <grandson name="儿12"></grandson>

不加自闭合 <grandson name="儿12" />

注释

xml_declaration=True

加上使xml文件有注释　　<?xml version='1.0' encoding='utf-8'?>

由于原生保存的XML时默认无缩进，如果想要设置缩进的话，需要修改保存方式：

from xml.etree import ElementTree as ET

from xml.dom import minidom

def prettify(elem):

    """将节点转换成字符串，并添加缩进。

    """

    rough_string = ET.tostring(elem, 'utf-8')

    reparsed = minidom.parseString(rough_string)

    return reparsed.toprettyxml(indent="\t")

# 创建根节点

root = ET.Element("famliy")

# 创建大儿子

# son1 = ET.Element('son', {'name': '儿1'})

son1 = root.makeelement('son', {'name': '儿1'})

# 创建小儿子

# son2 = ET.Element('son', {"name": '儿2'})

son2 = root.makeelement('son', {"name": '儿2'})

# 在大儿子中创建两个孙子

# grandson1 = ET.Element('grandson', {'name': '儿11'})

grandson1 = son1.makeelement('grandson', {'name': '儿11'})

# grandson2 = ET.Element('grandson', {'name': '儿12'})

grandson2 = son1.makeelement('grandson', {'name': '儿12'})

son1.append(grandson1)

son1.append(grandson2)

# 把儿子添加到根节点中

root.append(son1)

root.append(son1)

raw_str = prettify(root)

f = open("xxxoo.xml",'w',encoding='utf-8')

f.write(raw_str)

f.close()

自己写的

from xml.etree import ElementTree as f

from xml.dom import minidom

def prettify(elem):

    """将节点转换成字符串，并添加缩进。

    """

    rough_string = f.tostring(elem, 'utf-8')

    reparsed = minidom.parseString(rough_string)

    return reparsed.toprettyxml(indent="\t")

a=f.Element("QWE")

b=a.makeelement("asd",{"K1":"V2"})

c=a.makeelement("zxc",{"K1":"V2"})

a.set("name","lu")

a.append(b)

b.append(c)

z=prettify(a)       #转成字符串了直接写入

s=open("xxxx.xml","w")

s.write(z)

s.close()

xml中俩种解析方式的更多相关文章

Android平台中实现对XML的三种解析方式
本文介绍在Android平台中实现对XML的三种解析方式. XML在各种开发中都广泛应用,Android也不例外.作为承载数据的一个重要角色,如何读写XML成为Android开发中一项重要的技能. 在 ...
xml常用四种解析方式优缺点的分析×××××
xml常用四种解析方式优缺点的分析博客分类: xml 最近用得到xml的解析方式,于是就翻了翻自己的笔记同时从网上查找了资料,自己在前人的基础上总结了下,贴出来大家分享下. 首先介绍一下xml语 ...
XML 的4种解析方式
在上一篇博客中,我们介绍了什么是 XML ,http://www.cnblogs.com/ysocean/p/6901008.html,那么这一篇博客我们介绍如何来解析 XML . 部分文档引用:ht ...
Web.xml中四种验证方式
源地址:https://blog.csdn.net/imimi_/article/details/78805642 <security-constraint> 的子元素 <http- ...
XML解析——Java中XML的四种解析方式
XML是一种通用的数据交换格式,它的平台无关性.语言无关性.系统无关性.给数据集成与交互带来了极大的方便.XML在不同的语言环境中解析方式都是一样的,只不过实现的语法不同而已. XML的解析方式分为四 ...
XML解析——Java中XML的四种解析方式（转载 by 龍清扬）
XML是一种通用的数据交换格式,它的平台无关性.语言无关性.系统无关性.给数据集成与交互带来了极大的方便.XML在不同的语言环境中解析方式都是一样的,只不过实现的语法不同而已. XML的解析方式分为四 ...
Java中XML的四种解析方式（二）
三.JDOM解析特征: 1.仅使用具体类,而不使用接口. 2.API大量使用了Collections类. import org.jdom2.Attribute; import org.jdom2.D ...
Java中XML的四种解析方式（一）
XML是一种通用的数据交换格式,它的平台无关性.语言无关性.系统无关性给数据集成与交互带来了极大的方便.XML在不同的语言环境中解析的方式都是一样的,只不过实现的语法不同而已. XML文档以层级标签的 ...
XML的两种解析方式
JDK提供的XML解析方式分为两种:DOM方式和SAX方式DOM:Document Object Model.需要读取整个XML文档,先需要在内存中构架代表整个DOM树的Document对象,可以进行 ...

随机推荐

TCP segment of a reassembled PDU
Wireshark有时候会显示这个东东. 此处PDU是指上层(如HTTP)的Protocol Data Unit,意指上层协议的一个协议段太长,无法放入单个TCP数据包. 如果你在wireshark中 ...
bzoj3036: 绿豆蛙的归宿
Description 随着新版百度空间的下线,Blog宠物绿豆蛙完成了它的使命,去寻找它新的归宿. 给出一个有向无环的连通图,起点为1终点为N,每条边都有一个长度.绿豆蛙从起点出发,走向终点.到达每 ...
erlang使用leveldb
用的是诺顿的开源库,参考url来自这里下载 git clone git@github.com:/norton/lets.git 编译 cd lets ./rebar get-deps ./rebar ...
黄聪：wordpress/wp-includes目录文件
wp-includes/cache.php wp-includes/capabilities.php wp-includes/class-IXR.php:Incutio XML-RPC库.包括了 XM ...
队列(Queue)--环形队列、优先队列和双向队列
1. 队列概述队列和堆栈都是有序列表,属于抽象型数据类型(ADT),所有加入和删除的动作都发生在不同的两端,并符合First In, First Out(先进先出)的特性. 特性: ·FIFO ·拥 ...
最大熵的Java实现
这是一个最大熵的简明Java实现,提供训练与预测接口.训练采用GIS训练算法,附带示例训练集.本文旨在介绍最大熵的原理.分类和实现,不涉及公式推导或其他训练算法,请放心食用. 最大熵理论简介最大熵 ...
unity jiaoben
transform.Translate(Input.GetAxis("Horizontal")*Time.deltaTime,0,0); 移动 transform.Translat ...
C#3
定义常量:1.静态常量 const(定义时必须初始化) ...常量都不可以改变 2.动态常量 readonly(定义时不必初始化) \\要在Main方法前面用法:const double PI = ...
dbs:apple-notes
ylbtech-dbs:apple-notes -- =============================================-- apple_备忘录-- auhtor:Yuanbo ...
JAVA 数组实例-求学生平均成绩，与计算数组的长度
实例: 知识点:数组名.length是计算数组的长度 import java.util.*; //求学生平均分成绩 public class Test{ public static void main ...

xml中俩种解析方式

xml中俩种解析方式的更多相关文章

随机推荐

热门专题