Python-elementTree方法解析xml文件-01
【XML基本概念介绍】
XML 指可扩展标记语言(eXtensible Markup Language)。
XML 被设计用来传输和存储数据。
概念一:
<foo> # foo元素的起始标签
</foo> # foo元素的结束标签
# note: 每一个起始标签必须有对应的结束标签来闭合, 也可以写成<foo/>
概念二:
<foo> # 元素可以嵌套到任意参次
<bar></bar> # bar元素为foo元素的子元素
</foo> # 父元素foo的结束标签
概念三:
<foo lang='EN'>#foo元素有个lang的属性,该属性值为:EN 对应Python字典Name-Value对
<bar id='001' lang="CH"></bar> # bar元素有个lang的属性,该属性值为:CH;还有个id属性,值为:001,放置在''或“”中;
</foo> # bar元素中的lang属性不会和foo元素中相冲突,每个元素都有独立的属性集;
概念四:
<title>Learning Python</title> # 元素可以有文本内容
# Note:如果一个元素即没有文本内容,也没有子元素,则为空元素。
概念五:
<info> # info元素为根节点
<list id='001'> A </list> # list元素为子节点
<list id='002'> B </list>
<list id='003'> C </list>
</info>
概念六:
<feed xmlns='http://www.w3.org/2005/Atom'>#可以通过声明xmlns来定义默认名字空间,feed元素处于http://www.w3.org/2005/Atom命名空间中
<title>dive into mark</title>#title元素也是。名字空间声明不仅会作用于当前声明它的元素,还会影响到该元素的所有子元素
</feed>#也可以通过xmlns:prefix声明来定义一个名字空间并取其名为prefix。然后该名字空间中的每个元素都必须显式地使用这个前缀(prefix)来声明。
<atom:feed xmlns:atom='http://www.w3.org/2005/Atom'> # feed属于命名空间atom
<atom:title>dive into mark</atom:title>#title元素同样属于该命名空间
</atom:feed> # xmlns(XML Name Space)
【ElementTree解析】
两种实现
ElementTree生来就是为了处理XML ,它在Python标准库中有两种实现。
一种是纯Python实现,例如: xml.etree.ElementTree
另外一种是速度快一点的: xml.etree.cElementTree
尽量使用C语言实现的那种,因为它速度更快,而且消耗的内存更少! 在程序中可以这样写:
try:
import xml.etree.cElementTree as ET
except ImportError:
import xml.etree.ElementTree as ET
常用方法
# 当要获取属性值时,用attrib方法。
# 当要获取节点值时,用text方法。
# 当要获取节点名时,用tag方法。
示例XML
<?xml version="1.0" encoding="utf-8"?>
<info>
<intro>Book message</intro>
<list id='001'>
<head>bookone</head>
<name>python check</name>
<number>001</number>
<page>200</page>
</list>
<list id='002'>
<head>booktwo</head>
<name>python learn</name>
<number>002</number>
<page>300</page>
</list>
</info>
加载XML
root = ET.parse(‘book.xml’)
加载字符串
root = ET.fromstring(xmltext)
获得指定节点:
方法一:获得指定节点->getiterator()方法
book_node = root.getiterator('list')
方法二:获得指定节点->findall()方法
book_node = root.findall('list')
方法三:获得指定节点->find()方法
book_node = root.find('list')
方法四:获得儿子节点->getchildren()
for node in book_node:
book_node_child = node.getchildren()[0]
print book_node_child.tag, '=> ', book_node_child.text
示例:
try:
import xml.etree.cElementTree as ET
except ImportError:
import xml.etree.cElementTree as ET root = ET.parse(r'I:\PythonTest\book.xml') #加载文件
books = root.findall('./list')
for book_list in books:
print('='*30)
for book in book_list:
if id in book.attrib :
print('id:',book.attrib['id'])
print(book.tag + '==>' + book.text)
print('='*30)
输出结果:
==============================
head==>bookone
name==>python check
number==>001
page==>200
==============================
head==>booktwo
name==>python learn
number==>002
page==>300
==============================
转自:http://www.jb51.net/article/67120.htm
Python-elementTree方法解析xml文件-01的更多相关文章
- 对DOM,SAX,JDOM,DOM4J四种方法解析XML文件的分析
1.DOM 与平台无关的官方解析方式 DOM是一次性把xml文件加载到内存中,形成一个节点树 对内存有要求 2.SAX java提供的基于事件驱动的解析方式 每次遇到一个标签,会触发相应的事件方法 3 ...
- python解析xml文件时使用ElementTree和cElementTree的不同点;iter
在python中,解析xml文件时,会选用ElementTree或者cElementTree,那么两者有什么不同呢? 1.cElementTree速度上要比ElementTree快,比较cElemen ...
- JAVA中使用DOM解析XML文件
XML是一种方便快捷高效的数据保存传输的格式,在JSON广泛使用之前,XML是服务器和客户端之间数据传输的主要方式.因此,需要使用各种方式,解析服务器传送过来的信息,以供使用者查看. JAVA作为一种 ...
- 【JAVA使用XPath、DOM4J解析XML文件,实现对XML文件的CRUD操作】
一.简介 1.使用XPath可以快速精确定位指定的节点,以实现对XML文件的CRUD操作. 2.去网上下载一个“XPath帮助文档”,以便于查看语法等详细信息,最好是那种有很多实例的那种. 3.学习X ...
- iOS 详解NSXMLParser方法解析XML数据方法
前一篇文章已经介绍了如何通过URL从网络上获取xml数据.下面介绍如何将获取到的数据进行解析. 下面先看看xml的数据格式吧! <?xml version="1.0" enc ...
- Java是如何解析xml文件的(DOM)
Java解析xml文件 在Java程序中读取xml文件的过程也称为"解析xml文件": 解析的目的: 获取 节点名和节点值 获取 属性名.属性值. 四中解析方式: DOM SAX ...
- 安卓开发之利用XmlPullParser解析XML文件
package com.lidaochen.phonecall; import android.support.v7.app.AppCompatActivity; import android.os. ...
- 遍历文件 创建XML对象 方法 python解析XML文件 提取坐标计存入文件
XML文件??? xml即可扩展标记语言,它可以用来标记数据.定义数据类型,是一种允许用户对自己的标记语言进行定义的源语言. 里面的标签都是可以随心所欲的按照他的命名规则来定义的,文件名为roi.xm ...
- python XML文件解析:用xml.dom.minidom来解析xml文件
python解析XML常见的有三种方法: 一是xml.dom.*模块,是W3C DOM API的实现,若需要处理DOM API则该模块很合适, 二是xml.sax.*模块,它是SAX API的实现,这 ...
随机推荐
- Linux系统文本命令快速登录与退出
Linux是一个多用户的操作系统,用户要使用该系统,首先必须登录系统,使用完系统后,必须退出系统.用户登录系统时,为了使系统能够识别自己,必须输入用户名和密码,经系统验证无误后方能进入系统.在系统安装 ...
- MySQL查看数据库大小、表大小和最后修改时间
查看数据库表基本信息. select * from information_schema.TABLES where information_schema.TABLES.TABLE_SCHEMA = ' ...
- web前端开发框架搜集
Web应用框架(Web application framework)是一种电脑软件框架,用来支持动态网站.网络应用程序及网络服务的开发.这种框架有助于减轻网页开发时共通性活动的工作负荷,例如许多框架提 ...
- var genreModel =storeDB.Genres.Include("Albums").Single(g => g.Name == genre);是什么意思?
g => g.Name == genre代表一个匿名函数.即这里向Single方法传入了一个方法类型的参数. =>左边的g代表方法的参数,可以有多个,如(g,f) => ...,=& ...
- 基于.NET MVC的高性能IOC插件化架构(二)之插件加载原理
上一篇博文简单介绍了下插件化的代码组成部分:http://www.cnblogs.com/gengzhe/p/4390932.html,源码地址:https://github.com/luohuazh ...
- 开发H5小游戏
Egret白鹭H5小游戏开发入门(一) 前言: 好久没更新博客了,以前很多都不会,所以常常写博客总结,倒是现在有点点经验了就懒了.在过去的几个月里,在canvas游戏框架方面,撸过了CreateJ ...
- Apple Pay 应用 demo --备用哦
"iOS8.1就已经有这个功能了,只是木有现在这么的火,现在的趋势是要火的节奏,因此很多电商平台B2B,P2P,C2C,X2X都有可能需要这个屌丝的付款功能了,在此简单的研究一下." ...
- CCAN:C语言的模块仓库
实践中一门编程语言是否有用.好不好,不仅体现在语言本身,更在语言的生态系统:用的人多不多.社区是否活跃互帮互助.语言的相关库和框架质量如何,还有就是已有的模块的质量与数量. CPAN(Comprehe ...
- nodejs定时任务node-schedule
1:使用npm安装node-schedule模块 npm install node-schedule (1)每隔5分钟执行一次: var schedule = require('node-schedu ...
- 公网IP和私有IP
IP地址是为了区分网络中不同主机所分配的一个地址,通过IP地址可以访问到每一台主机. IP地址分为公有地址和私有地址,公有地址由Internet NIC负责(比如中国互联网信息中心http://ip. ...