python使用SAX解析xml
python 标准库包含SAX解析器,SAX用事件驱动模型,通过在解析XML的过程中触发一个个的事件并调用用户定义的回调函数来处理XML文件 在python中使用sax方式处理xml要先引入xml.sax中的parse函数,还有xml.sax.handler中的ContentHandler ContentHandler类方法介绍 # characters(content)方法
# 调用时机:
# 从行开始,遇到标签之前,存在字符,content的值为这些字符串。
# 从一个标签,遇到下一个标签之前, 存在字符,content的值为这些字符串。
# 从一个标签,遇到行结束符之前,存在字符,content的值为这些字符串。
# 标签可以是开始标签,也可以是结束标签。 # startDocument()方法
# 文档启动的时候调用。 # endDocument()方法
# 解析器到达文档结尾时调用。 # startElement(name, attrs)方法
# 遇到XML开始标签时调用,name是标签的名字,attrs是标签的属性值字典。 # endElement(name)方法
# 遇到XML结束标签时调用。 # make_parser方法
# 创建一个新的解析器对象并返回。
# xml.sax.make_parser( [parser_list] ) # (parser_list - 可选参数,解析器列表) # parser方法
# 创建一个 SAX 解析器并解析xml文档:
# xml.sax.parse( xmlfile, contenthandler[, errorhandler])
# 参数说明:
# xmlfile - xml文件名
# contenthandler - 必须是一个ContentHandler的对象
# errorhandler - 如果指定该参数,errorhandler必须是一个SAX ErrorHandler对象 # parseString方法
# parseString方法创建一个XML解析器并解析xml字符串
# xml.sax.parseString(xmlstring, contenthandler[, errorhandler])
# 参数说明:
# xmlstring - xml字符串
# contenthandler - 必须是一个ContentHandler的对象
# errorhandler - 如果指定该参数,errorhandler必须是一个SAX ErrorHandler对象
# eg_v1 import xml.sax class MovieHandler(xml.sax.ContentHandler):
def __init__(self):
self.CurrentData = ""
self.type = ""
self.format = ""
self.year = ""
self.rating = ""
self.stars = ""
self.description = "" # 开始元素处理
def startElement(self, tag, attributes):
self.CurrentData = tag
if tag == "movie":
print ("*****movie*****")
title = attributes["title"]
print ("title:",title) # 元素结束处理
def endElement(self, tag):
if self.CurrentData == "type":
print ("type:",self.type)
elif self.CurrentData == "format":
print ("format:",self.format)
elif self.CurrentData == "year":
print ("year:",self.year)
elif self.CurrentData == "rating":
print ("rating:",self.rating)
elif self.CurrentData == "stars":
print ("stars:",self.stars)
elif self.CurrentData == "description":
print ("description:",self.description) # 内容事件处理
def characters(self, content):
if self.CurrentData == "type":
self.type = content
elif self.CurrentData == "format":
self.format = content
elif self.CurrentData == "year":
self.year = content
elif self.CurrentData == "rating":
self.rating = content
elif self.CurrentData == "stars":
self.stars = content
elif self.CurrentData == "description":
self.description =content if (__name__ == "__main__"): parser = xml.sax.make_parser()
parser.setFeature(xml.sax.handler.feature_namespaces,0) Headler = MovieHandler()
parser.setContentHandler( Headler ) parser.parse("movies.xml") # *****movie*****
# title: Enemy Behind
# type: War, Thriller
# format: DVD
# year: 2003
# rating: PG
# stars: 10
# description: Talk about a US-Japan war
# description:
#
# *****movie*****
# title: Transformers
# type: Anime, Science Fiction
# format: DVD
# year: 1989
# rating: R
# stars: 8
# description: A schientific fiction
# description:
#
# *****movie*****
# title: Trigun
# type: Anime, Action
# format: DVD
# rating: PG
# stars: 10
# description: Vash the Stampede!
# description:
#
# *****movie*****
# title: Ishtar
# type: Comedy
# format: VHS
# rating: PG
# stars: 2
# description: Viewable boredom
# description:
python使用SAX解析xml的更多相关文章
- Python:使用基于事件驱动的SAX解析XML
SAX的特点: 是基于事件的 API 在一个比 DOM 低的级别上操作 为您提供比 DOM 更多的控制 几乎总是比 DOM 更有效率 但不幸的是,需要比 DOM 更多的工作 基于对象和基于事件的接口 ...
- python sax解析xml
#books.xml<catalog> <book isbn="0-596-00128-2"> <title>Python & XML& ...
- Python—使用xml.sax解析xml文件
什么是sax? SAX是一种基于事件驱动的API. 利用SAX解析XML文档牵涉到两个部分:解析器和事件处理器. 解析器负责读取XML文档,并向事件处理器发送事件,如元素开始跟元素结束事件; 而事件处 ...
- Android之SAX解析XML
一.SAX解析方法介绍 SAX(Simple API for XML)是一个解析速度快并且占用内存少的XML解析器,非常适合用于Android等移动设备. SAX解析器是一种基于事件的解析器,事件驱动 ...
- Android 使用pull,sax解析xml
pull解析xml文件 1.获得XmlpullParser类的引用 这里有两种方法 //解析器工厂 XmlPullParserFactory factory=XmlPullParserFactory. ...
- JAVA使用SAX解析XML文件
在我的另一篇文章(http://www.cnblogs.com/anivia/p/5849712.html)中,通过一个例子介绍了使用DOM来解析XML文件,那么本篇文章通过相同的XML文件介绍如何使 ...
- DOM&SAX解析XML
在上一篇随笔中分析了xml以及它的两种验证方式.我们有了xml,但是里面的内容要怎么才能得到呢?如果得不到的话,那么还是没用的,解析xml的方式主要有DOM跟SAX,其中DOM是W3C官方的解析方式, ...
- cocos2d-x 3.0 使用Sax解析xml文件(中国显示器问题解决)
今天是个好日子.我以为事情可以变得,明天是个好日子.打开门儿春风... 恩,听着歌写文档生活就是这么享受. 今天曾经的邻居大神突然在qq上赞了我一下,这让我异常激动啊.. 这还要从前前前几天说起,那会 ...
- SAX解析xml浅析
SAX解析XML文件采用事件驱动的方式进行,也就是说,SAX是逐行扫描文件,遇到符合条件的设定条件后就会触发特定的事件,回调你写好的事件处理程序.使用SAX的优势在于其解析速度较快,占用内存较少(相对 ...
随机推荐
- JS页面跳转代码怎么写?总结了5种方法
我们在建站时有些链接是固定的,比如客服咨询链接,一般是第三方url,如果直接加上去不太专业,那么就想着用站内的页面做跳转,跳转用js比较多,那么JS页面跳转代码怎么写呢?ytkah在网上搜索了一下,大 ...
- RN Animated透明度动画
主要代码解析: 如果我们希望吧Animated.Value从0变化到1,把组件位置从60px移动到0px,把不透明度从0编导1,就可以使用style的属性来实现 <Animated.Text s ...
- Cookie和Session的区别?
1.Cookie和Session都是会话技术,Cookie是运行在客户端,Session是运行在服务器端. 2.Cookie有大小限制以及浏览器在存cookie的个数也有限制,Session ...
- MySQL数据库查询操作进阶——多表查询
多表查询 在大部分情况下,我们用到的表都是彼此相关联的,所以我们会有相当大的需求用到跨表的查询,这个时候我们就需要将相关联的表连起来做多表查询. 多表查询分为连表查询和子查询,连表查询即将相关联的表连 ...
- Day2 Python基础学习——字符串、列表、元组、字典、集合
Python中文学习大本营:http://www.pythondoc.com/ 一.字符串操作 一.用途:名字,性格,地址 name = 'wzs' #name = str('wzs')print(i ...
- vue2.0--请求数据
vue中用vue-reouse请求来的数据,会被封装一层,如下图res:
- vector erase的错误用法
直接写 a.erase(it)是错误的,一定要写成it=a.erase(it)这个错误编译器不会报错.而且循环遍历删除的时候,删除了一个元素,容器里会自动向前移动,删除一个元素要紧接着it--来保持位 ...
- Kotlin 型变 + 星号投影(扯蛋)
Kotlin中的型变: 1. in,顾名思义,就是只能作为传入参数的参数类型 2.out, ..............,就是只能作为返回类型参数的参数类型 星号投影: 我们引用官网的吧-- For ...
- 10.C# 构造函数
1.构造函数 构造函数是用来初始化对象的,只能由new运算符调用.构造函数与类同名,没有返回值,不能用void修饰,可以有public和private两种修饰符,当用private修饰时外界不能访问到 ...
- 记录python万恶的坑
1.PyCharm Process finished with exit code -1073741819 (0xC0000005) 解决方法:卸载h5py这个包,在装cv2的时候有可能安装了h5py ...