python开发_xml.dom_解析XML文档_完整版

在阅读之前，你需要了解一些xml.dom的一些理论知识，在这里你可以对xml.dom有一定的了解，如果你阅读完之后。

下面是我做的demo

运行效果:

解析的XML文件位置：c:\\test\\hongten.xml

 <?xml version="1.0" encoding="UTF-8"?>

 <students>

     <student no="2009081097">

         <name>Hongten</name>

         <gender>M</gender>

         <age>20</age>

         <score subject="math">97</score>

         <score subject="chinese">90</score>

     </student>

     <student no="2009081098">

         <name>DuDu</name>

         <gender>W</gender>

         <age>21</age>

         <score subject="math">87</score>

         <score subject="chinese">96</score>

     </student>

     <student no="2009081099">

         <name>Sum</name>

         <gender>M</gender>

         <age>19</age>

         <score subject="math">64</score>

         <score subject="chinese">98</score>

     </student>

 </students>

====================================================

代码部分：

====================================================

 #python xml.dom

 #Author   :   Hongten

 #Mailto   :   hongtenzone@foxmail.com

 #Blog     :   http://www.cnblogs.com/hongten

 #QQ       :   648719819

 #Version  :   1.0

 #Create   :   2013-09-03

 import os

 from xml.dom import minidom

 #global var

 SHOW_LOG = True

 XML_PATH = None

 def get_dom_by_parse(path):

     '''根据XML文件地址解析XML文件，返回dom对象'''

     if os.path.exists(path):

         if SHOW_LOG:

             print('开始解析XML文件：[{}]'.format(path))

         return minidom.parse(path)

     else:

         print('the path [{}] dose not exist!'.format(path))

 def get_dom_by_file(path):

     '''解析作为文档打开的XML文件'''

     if os.path.exists(path):

         if SHOW_LOG:

             print('开始打开XML文件：[{}]'.format(path))

         with open(path) as pf:

             if SHOW_LOG:

                 print('开始解析XML文件：[{}]'.format(path))

             return minidom.parse(pf)

     else:

         print('the path [{}] dose not exist!'.format(path))

 def get_dom_by_string(s):

     '''解析以字符串形式的XML数据格式'''

     if s is not None and s != '':

         if SHOW_LOG:

             print('开始解析字符串形式的XML数据：[{}]'.format(s))

         return minidom.parseString(s)

     else:

         print('the input string is None or equals \'\'.')

 def get_root(dom):

     '''返回XML文件的根节点'''

     if dom is not None:

         return dom.documentElement

     else:

         print('the dom is None!')

 def get_element_children(fatherElement, subNodeName):

     '''根据父节点fatherElement获取子节点subNodeName'''

     if fatherElement is not None:

         if subNodeName is not None and subNodeName != '':

             return fatherElement.getElementsByTagName(subNodeName)

         else:

             print('the sub node name is None or equals \'\'.')

     else:

         print('the father node is None!')

 def get_element_value(element, index=0):

     '''获取节点的值'''

     if element is not None:

         return element.childNodes[index].nodeValue

     else:

         print('the element is None!')

 def get_element_attrib_value(element, name):

     '''根据节点element的属性名称name获取属性名称的值'''

     if element is not None:

         if name is not None and name != '':

             return element.getAttribute(name)

         else:

             print('the name is None or equals \'\'.')

     else:

         print('the element is None!')

 def get_info(root_children):

     '''解析XML内容'''

     info = []

     for item in root_children:

         subs = []

         score_value = []

         i_no = get_element_attrib_value(item, 'no')

         i_name = get_element_children(item, 'name')

         i_gender = get_element_children(item, 'gender')

         i_age = get_element_children(item, 'age')

         i_score = get_element_children(item, 'score')

         for sub in i_score:

             i_sub = get_element_attrib_value(sub, 'subject')

             subs.append(i_sub)

         v_name = get_element_value(i_name[0])

         v_gender = get_element_value(i_gender[0])

         v_age = get_element_value(i_age[0])

         for s in range(len(i_score)):

             score_value.append(s)

         v_score = dict(zip(subs, score_value))

         info.append(v_name)

         info.append(v_gender)

         info.append(v_age)

         info.append(v_score)

     return info

 def init():

     global SHOW_LOG

     SHOW_LOG = True

     global XML_PATH

     XML_PATH = 'C:\\test\\hongten.xml'

 def main():

     init()

     dom = get_dom_by_parse(XML_PATH)

     root = dom.documentElement

     print(root)

     root_children = get_element_children(root, 'student')

     print(root_children)

     info = get_info(root_children)

     print(info)

 if __name__ == '__main__':

     main()

python开发_xml.dom_解析XML文档_完整版_博主推荐的更多相关文章

python优秀库－使用xmltodict解析xml文档
上次讲到如何使用BeautifulSoup解析XML文档,今天发现另外一个python库xmltodict(https://github.com/martinblech/xmltodict)也很简单. ...
Objective-C ,ios,iphone开发基础:使用GDataXML解析XML文档,(libxml/tree.h not found 错误解决方案)
使用GDataXML解析XML文档在IOS平台上进行XML文档的解析有很多种方法,在SDK里面有自带的解析方法,但是大多情况下都倾向于用第三方的库,原因是解析效率更高.使用上更方便这里主要介绍一下 ...
四种生成和解析XML文档的方法详解（介绍+优缺点比较+示例）
众所周知,现在解析XML的方法越来越多,但主流的方法也就四种,即:DOM.SAX.JDOM和DOM4J 下面首先给出这四种方法的jar包下载地址 DOM:在现在的Java JDK里都自带了,在xml- ...
浅谈用java解析xml文档（四）
继续接上一文,这一阵子因为公司项目加紧,导致最后一个解析xml文档的方式,还没有总结,下面总结使用dom4J解析xml. DOM4J(Document Object Model for Java) 使 ...
浅谈用java解析xml文档（二）
上一文中总结了dom解析xml文档的方式,本文开始总结使用SAX解析xml 的方式及它的优缺点! SAX(Simple API for XML),是指一种接口,或者一个软件包. 首先我们应该知道SAX ...
DOM4J解析XML文档
Tip:DOM4J解析XML文档 Dom4j是一个简单.灵活的开放源代码的库.Dom4j是由早期开发JDOM的人分离出来而后独立开发的.与JDOM不同的是,dom4j使用接口和抽象基类,虽然Dom4j ...
dom4j解析xml文档全面介绍
一.dom4j介绍 dom4j是一个Java的XML API,类似于jdom,用来读写XML文件的.dom4j是一个非常非常优秀的Java XML API,具有性能优异.功能强大和极端易用使用的特点, ...
四种生成和解析XML文档的方法详解
众所周知,现在解析XML的方法越来越多,但主流的方法也就四种,即:DOM.SAX.JDOM和DOM4J 下面首先给出这四种方法的jar包下载地址 DOM:在现在的Java JDK里都自带了,在xml- ...
Java高级特性第14节解析XML文档(2) - SAX 技术
一.SAX解析XML文档 SAX的全称是Simple APIs for XML,也即XML简单应用程序接口.与DOM不同,SAX提供的访问模式是一种顺序模式,这是一种快速读写XML数据的方式.当使用S ...

随机推荐

JDK1.8源码之String
一.String类型引用博文连接: https://blog.csdn.net/ylyg050518/article/details/52352993 一.成员变量 //用于存储字符串 priva ...
Python Challenge 第 5 关攻略：peak
# -*- coding: utf-8 -*- # @Time : 2018/9/26 14:03 # @Author : cxa # @File : pickledemo.py # @Softwar ...
word文档下划线无法显示的解决方法
在编辑文档的时候经常会遇到下划线无法显示的情况,如图: 如果遇到不能在姓名后面加下划线的情况,我们该怎么做? 请看下面的图解: 1.首先点击左上角的office图标 2.点击右下角“word选项” 3 ...
安装Visual Studio Scrum 1.0过程模板
近几年里,Scrum变成了相当流行的软件开发方法学.因为它轻量.可迭代且快速等优点,以致于在敏捷开发中极受欢迎.微软甚至将TFS2010自带的MSF Agile5.0过程模板做得像Scrum,开发者们 ...
理解 Linux 的硬链接与软链接(待研究)
从 inode 了解 Linux 文件系统硬链接与软链接是 Linux 文件系统中的一个重要概念,其涉及文件系统中的索引节点 (index node 又称 inode),而索引节点对象是 Linux ...
说一下怎么搭建外网来访问SVN服务器
一.搭建SVN服务器 1.所需软件 TortoiseSVN,下载地址http://tortoisesvn.net/downloads.html TortoiseSVN中文语言包,下载地址http:// ...
Ubuntu 18.04安装MongoDB 4.0（社区版）
Ubuntu 18.04(虚拟机VirtualBox上),MongoDB 4.0, 听室友说,23点有世界杯决赛呢!可是,孤要写博文的啊!以记录这忙乱的下午和晚间成功安装了一个软件到Linux上.—— ...
数据科学实战手册(R+Python)书中引用资料网址
本文会持续将<数据科学实战手册(R+Python)>一书中的附带参考资料网址手打出来, 方便访问. 由于书中的参考资料网址太多, 这个文档将可能花费一段时间才能完成. 第一章 P7 Rs ...
C# listView subitem 问本值 text 改变界面会闪烁
解决方法就是重写ListView,然后设置双缓冲即可,然后再使用DoubleBufferListView,就不会闪烁了.下面的代码是DoubleBufferListView,并使用FrmMain来测 ...
16/11/22_plsql
1.数据类型: char 固定长度,varchar 字符长度按照实际长度, varchar2 字符均存储2个字节, nvarchar 按照Unicode存储.number(m,n)总长度m,小数 n. ...

python开发_xml.dom_解析XML文档_完整版_博主推荐

python开发_xml.dom_解析XML文档_完整版_博主推荐的更多相关文章

随机推荐

热门专题