Python—使用xm.dom解析xml文件

什么是DOM？

文件对象模型（Document Object Model，简称DOM），是W3C组织推荐的处理可扩展置标语言的标准编程接口。

一个 DOM 的解析器在解析一个 XML 文档时，一次性读取整个文档，把文档中所有元素保存在内存中的一个树结构里，之后你可以利用DOM 提供的不同的函数来读取或修改文档的内容和结构，也可以把修改过的内容写入xml文件。

优点：操作简单，容易理解

缺点：因DOM需要将XML数据映射到内存中的树，一是比较慢，二是比较耗内存

movies.xml:需要解析的xml文件如下：

<collection shelf="New Arrivals">

<movie title="Enemy Behind">

   <type>War, Thriller</type>

   <format>DVD</format>

   <year>2003</year>

   <rating>PG</rating>

   <stars>10</stars>

   <description>Talk about a US-Japan war</description>

</movie>

<movie title="Transformers">

   <type>Anime, Science Fiction</type>

   <format>DVD</format>

   <year>1989</year>

   <rating>R</rating>

   <stars>8</stars>

   <description>A schientific fiction</description>

</movie>

<movie title="Trigun">

   <type>Anime, Action</type>

   <format>DVD</format>

   <episodes>4</episodes>

   <rating>PG</rating>

   <stars>10</stars>

   <description>Vash the Stampede!</description>

</movie>

<movie title="Ishtar">

   <type>Comedy</type>

   <format>VHS</format>

   <rating>PG</rating>

   <stars>2</stars>

   <description>Viewable boredom</description>

</movie>

</collection>

xmltest.py:解析movies.xml文件的python代码如下：

# -*- coding:UTF-8 -*-

'''

Created on 2015年9月10日

@author: xiaowenhui

'''

from xml.dom.minidom import parse

import xml.dom.minidom

#第一种方法，DOM解析

#使用minidom解析器打开xml文档

DOMTree  = xml.dom.minidom.parse("movies.xml")

collection = DOMTree.documentElement

#在集合中获取所有电影

movies = collection.getElementsByTagName("movie")

#打印每部电影的详细信息

dict_movies = {}

for movie in movies:

    dict_movie = {}

    title = ""

    print "*****Movie*****"

    if movie.hasAttribute("title"): #具有属性

        print "Title:%s" % movie.getAttribute("title") #获取属性值

        title = movie.getAttribute("title")

    try:

        type = movie.getElementsByTagName("type")[0]

        print "Type :%s" % type.childNodes[0].data

        dict_movie["type"] = type.childNodes[0].data

        format = movie.getElementsByTagName("format")[0] #获取该标签下的第一个子节点

        print "format:%s" % format.childNodes[0].data

        dict_movie["format"] = format.childNodes[0].data

        try:

            year = movie.getElementsByTagName("year")[0]

            print "year :%s" % year.childNodes[0].data

            dict_movie["year"] = year.childNodes[0].data

        except:

            pass

        try:

            episodes = movie.getElementsByTagName("episodes")[0]

            print "episodes:%s" % episodes.childNodes[0].data

            dict_movie["episodes"] = episodes.childNodes[0].data

        except:

            pass

        rating = movie.getElementsByTagName('rating')[0]

        print "Rating: %s" % rating.childNodes[0].data

        dict_movie["rating"] = rating.childNodes[0].data

        stars = movie.getElementsByTagName('stars')[0]

        print "stars: %s" % stars.childNodes[0].data

        dict_movie["stars"] = stars.childNodes[0].data

        description = movie.getElementsByTagName('description')[0]

        print "Description: %s" % description.childNodes[0].data

        dict_movie["description"] = description.childNodes[0].data

    except:

        print "error:" + title  + "\n"

        continue   

    dict_movies[title] = dict_movie

print dict_movies

解析后的输出结果如下：

*****Movie*****

Title:Enemy Behind

Type :War, Thriller

format:DVD

year :2003

Rating: PG

stars: 10

Description: Talk about a US-Japan war

*****Movie*****

Title:Transformers

Type :Anime, Science Fiction

format:DVD

year :1989

Rating: R

stars: 8

Description: A schientific fiction

*****Movie*****

Title:Trigun

Type :Anime, Action

format:DVD

episodes:4

Rating: PG

stars: 10

Description: Vash the Stampede!

*****Movie*****

Title:Ishtar

Type :Comedy

format:VHS

Rating: PG

stars: 2

Description: Viewable boredom

{u'Transformers': {'rating': u'R', 'description': u'A schientific fiction', 'format': u'DVD', 'stars': u'', 'year': u'', 'type': u'Anime, Science Fiction'}, u'Ishtar': {'rating': u'PG', 'type': u'Comedy', 'description': u'Viewable boredom', 'stars': u'', 'format': u'VHS'}, u'Enemy Behind': {'rating': u'PG', 'description': u'Talk about a US-Japan war', 'format': u'DVD', 'stars': u'', 'year': u'', 'type': u'War, Thriller'}, u'Trigun': {'rating': u'PG', 'description': u'Vash the Stampede!', 'format': u'DVD', 'episodes': u'', 'stars': u'', 'type': u'Anime, Action'}}

Python—使用xm.dom解析xml文件的更多相关文章

使用DOM解析xml文件
使用DOM解析xml文件要解析的xml文件如下: <?xml version="1.0" encoding="UTF-8"?> <Langu ...
DOM解析XML文件例子
DOM解析XML文件是一次性将目标文件中的所有节点都读入,然后再进行后续操作的方式. 一般分为以下几步: 1. 定义好目标XML文件路径path . 2. 实例化DOM解析工厂对象 ,Document ...
JAVA中使用DOM解析XML文件
XML是一种方便快捷高效的数据保存传输的格式,在JSON广泛使用之前,XML是服务器和客户端之间数据传输的主要方式.因此,需要使用各种方式,解析服务器传送过来的信息,以供使用者查看. JAVA作为一种 ...
使用DOM解析XML文件，、读取xml文件、保存xml、增加节点、修改节点属性、删除节点
使用的xml文件 <?xml version="1.0" encoding="GB2312" ?> <PhoneInfo> <Br ...
DOM解析XML文件实例
XML文件: response: <?xml version="1.0"?> <soap:Envelope xmlns:soap="http://www ...
dom 解析xml文件
JAXP技术 JAXP即Java Api for Xml Processing该API主要是SUN提供的用于解析XML数据的一整套解决方案,主要包含了DOM和SAX解析技术.大家可以参见SUN的以下两 ...
Qt中使用DOM解析XML文件或者字符串二（实例）
介绍在Qt中提供了QtXml模块实现了对XML数据的处理,我们在Qt帮助中输入关键字QtXml Module,可以看到该模块的类表.在这里我们可以看到所有相关的类,它们主要是服务于两种操作XML文档 ...
DOM解析XML文件
1.首先把第三方代码拖进工程 GDataXMLNode.h和GDataXMLNode.m这两个文件放进工程里面 2.引入libxml2库文件 3.将GDataXMLNode.h文件中的这两个东西在工程 ...
Dom解析XML文件具体用法
public class Dom4j { public static void main(String[] args) throws Exception { List<Student> l ...

随机推荐

JavaScript与jquery的对比
javascript jQuery 入口函数只能有一个,如果有多个,后面的会覆盖前面可以有多个,并且不会发生覆盖的情况代码容错性代码容错性差,代码出现错误,会影响到后面代码的运行. 代码容 ...
javascript中对象属性的介绍
<!DOCTYPE html> <html lang="en"> <head> <meta charset="UTF-8&quo ...
【Five-Minute Share】“为什么要选择自增型的主键”
我们在开发的时候经常会听到这样的建议:1. 设计数据库表的时候,要为每个表设置一个主键:2. 主键最好是跟业务无关的: 3. 最好是自增的: 于是,很多新入行的程序猿们把这些前辈们的教条拿来就用,每个 ...
给html里面的class添加一个判断语句，判断当前class是否显示（vue）
当我们想判断这个class是否出现时,其实有很多方法, 我这个是做了一个选项卡,当点击的时候navTitle的值和循环的item的值相同时class就等于borderbottom, 这样我们点击的图层 ...
如何构建和设计以确保 API 的安全性
如何构建和设计以确保 API 的安全性面对常见的OWASP十大威胁.未经授权的访问.拒绝服务攻击.以及窃取机密数据等类型的攻击,企业需要使用通用的安全框架,来保护其REST API,并保证良好的用户 ...
路飞学城Python-Day114
120-基于用户认证组件的登陆验证信息存储 from django.shortcuts import render, HttpResponse, redirect from django.contri ...
Nginx配置udp/tcp代理
#编译 ./configure --prefix=/servyouapp/nginx --with-stream --with-http_stub_status_module #nginx.conf部 ...
记Spring搭建功能完整的个人博客「Oyster」全过程[其二] Idea中Maven+SpringBoot多模块项目开发的设计和各种坑（模块间依赖和打包问题）
大家好嘞,今天闲着没事干开写写博客,记录一下Maven+SpringBoot的多模块设计和遇到的坑. 多模块设计简单说明一下截止目前的需求: 需要RESTful API:对文章.标签.分类和评论等的 ...
django rest-farme-work 的使用(3)
请求和响应 Requests and Responses 从这一片来说,我们将真正开始覆盖REST框架的核心.我们来介绍一些基本的构建块 Request objects REST框架引入了一个Requ ...
USB OTG学习笔记
仅仅看了半天SPEC写的笔记,有些乱,等调试完毕再次整理,思路不是很成熟,推测成分较多,可能有不对的地方,欢迎拍砖交流指正. 1. 概要 OTG设备使用插头中的ID引脚来区分A/B Dev ...