前言:
最近刚在廖雪峰老师的网站里学习了Python的基础内容,想着循序渐进地找点实例练练手,网上看到有很多相关资料,决定针对感兴趣的内容实际编码实践一下,昨天刚好看到有关使用Python来读取XML文件的资料,看起来还算简单,所以打算就从这里开始着手我的Python实践~
由于我只知道html这之类的标记语言,虽然也有看到过XML的文件,但是还没有了解过XML,所以就先去看了看有关XML的基本介绍,去W3C网站上实验了几个例子,大概知道了这是一个什么东西,下面有一些XML的基本概念,具体的可以去这里看看 -->http://www.w3school.com.cn/xml/
 
目录:
下面的内容结构如下:
一、什么是XML
二、XML(可扩展标记语言)与HTML(超文本标记语言)的关系
三、关于Python Minidom 四、开始用pyhton读取xml文件
--------------------------------------------------------------------------------------------------------------------------
正文:
一、什么是XML
  • XML指可扩展标记语言;
  • 它的设计宗旨是传输数据,而不是显示数据;(ps:不要指望 XML 文件会直接显示为 HTML 页面,XML 文档不会携带有关如何显示数据的信息)
  • 标签没有被预定义,需要自行定义标签
  • 对它最好的描述是:独立于软件和硬件的信息传输工具

二、XML(可扩展标记语言)与HTML(超文本标记语言)的关系

  • 可扩展标记语言是一种很像超文本标记语言的标记语言;(但不是超文本标记语言的替代,而是补充)
  • 它被用来传输和存储数据,其焦点是数据的内容;而超文本标记语言是用来显示数据的,其焦点是数据的外观。

三、关于Python Minidom

(ps: 网上找到有关Minidom的详解比较少,大多都是实例。但这里贴个Python官方的介绍地址-->https://wiki.python.org/moin/MiniDom )

用Minidom在XML文件中读取到的信息,可以看做是一个主结构,根据XML文件标签的结构层次,构成了树的结构。

树中每一个节点有三种基本属性:

根名.nodeName为节点标签的名字。比如<aa>标签的nodeName为aa

根名.nodeValue是节点的值,只对文本结点有效。

根名.nodeType是节点的类型(W3C有关XML的介绍中有节点类型的具体阐述--> http://www.w3school.com.cn/xmldom/dom_nodetype.asp

四、开始使用Python读取XML文件

1. 首先,建立一个测试用的XML文件,名为“123.xml”,比较简单,代码如下:

  <?xml version="1.0" encoding="UTF-8" ?>
<catalog>
<aa value="first">this is the 1st.</aa>
<aa value="second">this is the 2nd.</aa>
</catalog>

2. 在同一个目录下,建立一个名为“xml_read.py”的文件
         首先要导入minidom类库,导入方式有两种,对应的打开XML文件的语句也稍有不同。
      第一种:

 #导入类库
import xml.dom.minidom
#使用minidom里的parse()函数打开xml文档
dom = xml.dom.minidom.parse('123.xml')

第二种:

 #导入类库
from xml.dom import minidom
#使用minidom里的parse()函数打开文件
doc = minidom.parse('123.xml')

导入类库并成功打开XML文件后,要获取根节点,这里的“documentElement”有点像HTML语言里的使用:

 root = dom.documentElement

先试试将根节点相关的三种基本属性显示出来,代码如下:

 print root.nodeName
print root.nodeValue
print root.nodeType

“xml_read.py”的完整代码 以及 实验效果如下:

  #coding=utf-8

  #导入类库
import xml.dom.minidom #使用minidom里的parse()函数打开xml文档
dom = xml.dom.minidom.parse('123.xml') root = dom.documentElement
#每一个节点都有它的 nodeName、nodeValue、nodeType属性
print root.nodeName
print root.nodeValue
print root.nodeType

效果如下:

---------------------------------------------------------------------------------------------------------------------

刚刚演示的是对根节点的基本属性显示,下面演示怎么获取子元素的相关信息。

对于知道元素名字的子元素,可以使用getElementsByTagName方法获取,由该方法返回的是一个list,因此需要用循环来读出“123.xml”子标签的内容:

修改后的“xml_read.py”的完整代码如下:

  #coding=utf-8

  #导入类库
import xml.dom.minidom #使用minidom里的parse()函数打开xml文档
dom = xml.dom.minidom.parse('123.xml') root = dom.documentElement
nodes= root.getElementsByTagName("aa")
for n in nodes:
print n.getAttribute("value") #获取属性值
print n.childNodes[0].data #获取文本值

结果显示如下:

这只是我的第一个实例尝试,也希望自己之后能够坚持练习,多去发现问题解决问题,逐步提高自己~

【Python实例一】使用minidom读取xml文件的更多相关文章

  1. python读取xml文件

    关于python读取xml文章很多,但大多文章都是贴一个xml文件,然后再贴个处理文件的代码.这样并不利于初学者的学习,希望这篇文章可以更通俗易懂的教如何使用python 来读取xml 文件. 什么是 ...

  2. python专题-读取xml文件

    关于python读取xml文章很多,但大多文章都是贴一个xml文件,然后再贴个处理文件的代码.这样并不利于初学者的学习,希望这篇文章可以更通俗易懂的教如何使用python 来读取xml 文件. 什么是 ...

  3. 【304】python专题-读取xml文件

    参考:XML DOM 参考手册(w3school) 参考:python专题-读取xml文件 参考:请问用python怎么修改xml的节点值? 1. 读取标签内的文本(Python) 如下的 xml 文 ...

  4. 读取xml文件中的配置参数实例_java - JAVA

    文章来源:嗨学网 敏而好学论坛www.piaodoo.com 欢迎大家相互学习 paras.xml文件 <?xml version="1.0" encoding=" ...

  5. selenium-python读取XML文件

    首先这是我们要读取的XML文件 <?xml version="1.0" encoding="utf-8" ?><info> <ba ...

  6. java 读取XML文件作为配置文件

    首先,贴上自己的实例: XML文件:NewFile.xml(该文件与src目录同级) <?xml version="1.0" encoding="UTF-8&quo ...

  7. php使用domdocument读取xml文件

    使用domdocument读取xml文件需要用到以下几个方法和属性: 方法: 1:读取xml文件:load() 2:获取标签的对象数组:getElementByTagName() 3:对象数组的索引: ...

  8. Android 开发自己的网络收音机4——读取XML文件的电台数据

    国内外的电台数据很多,起码有好几百,所以把这些数据都写到代码里面是不实际的.只能写成一个数据文件,程序启动的时候再去加载.保存这些简单数据,我们肯定会优先使用XML文件,今天讲讲如何读取XML里面的数 ...

  9. 读取xml文件,写入excel

    在上一篇 Python写xml文件已经将所有订单写入xml文件,这一篇我们把xml文件中的内容读出来,写入excel文件. 输入xml格式: <?xml version="1.0&qu ...

随机推荐

  1. 使用polarssl进行RSA加密解密

    RSA算法的原理就不提了,网上有很多介绍的文章,因为项目中使用RSA加密,所以需要找一个RSA加密的算法,之前尝试过使用Crypto++库,无奈Crypto++其中使用了大量的模版,各种继承,看着头大 ...

  2. Selenium驱动Firefox浏览器

    用Maven构建Selenium依赖: <dependency> <groupId>org.seleniumhq.selenium</groupId> <ar ...

  3. JAVA虚拟机(一):内存区域

    根据<java虚拟机规范第二版>规定,现阶段的java内存区域总体如下图 其中,方法区和堆是所有线程共享区域. 虚拟机栈,本地方法栈,程序计数器是各线程独占. 概述一下各个区域 先说说线程 ...

  4. 分布式资源调度--YARN框架

    YARN产生背景 YARN是Hadoop2.x才有的,所以在介绍YARN之前,我们先看一下MapReduce1.x时所存在的问题: 单点故障 节点压力大 不易扩展 MapReduce1.x时的架构如下 ...

  5. 总结const

    int b; const int  *a=&b; int const * a=&b; int * const a =&b; const int *const a=&b; ...

  6. laydate日期控件

    <!-- laydate 日期时间控件 下载地址 http://www.layui.com/laydate/ 这里用到版本为 layDate-v5.0.2 下载后将 laydate 文件夹放到项 ...

  7. [Java] 各种常用函数

    1.writeInt()和readInt() 这两个函数并不是写入一个整数,读取一个整数.它们实际上是写入4个字节,读取4个字节. writeInt(int i)把i按四个字节,二进制形式写到输出流里 ...

  8. 制作用于日期时间型字段的DELPHI数据感知控件

    用DELPHI开发C/S应用方便而快速,因为它拥有大量易于使用的数据访问和数据感知控件.然而万事总是难以完美,DELPHI的DBEdit控件用于输入日期时间型字段却很不方便,为了改善这一缺点,笔者开发 ...

  9. CSS继承—深入剖析

    CSS的继承是指被包在内部的标签将拥有外部标签的样式性质.继承特性最典型的应用通常发挥在整个网页的样式预设,即整体布局声明.而需要要指定为其它样式的部份设定在个别元素里即可达到效果.这项特性可以给网页 ...

  10. ASP.NET页面之间传值Server.Transfer(4)

    这个才可以说是面象对象开发所使用的方法,其使用Server.Transfer方法把流程从当前页面引导到另一个页面中,新的页面使用前一个页面的应答流,所以这个方法是完全面象对象的,简洁有效. Serve ...