一、基本概要

XML,全称是eXtensible Markup Language,可扩展的标记语言,是Web服务的基础之一,使用XML,用户可以定义自己需要的标记。而用户创建的标记可以使用文档类型定义DTD(Document Type Definition)来定义,但是如果需要准确地描述数据的类型信息,并且便于计算机程序处理XML,则应该使用XSD大纲来定义新的标记。

二、XML的作用

1.存取数据

将数据存储到XML文件中供应用程序使用,例如:要在Web应用程序中显示页面的当前位置,可以将所有的页面信息存储到一个XML文件中,XML文件中元素之间的关系对应着页面之间的关系,然后应用程序读取XML文件中元素内容就可得到当前页面信息。

2.使内容与表示分离:

XML标记描述的是文档的结构和意义,也就是数据的实际内容,它不描述如何格式化并显示这些数据,显示数据的任务需要其他语言来描述。

3.提高数据共享的兼容性:

不兼容的两个系统可以使用同一XML文件来交互数据,不同的应用程序都可以使用同一XML来访问数据。

三、XML文挡结构

XML文档结构内容主要包括序言和文档元素,区分字母大小写.

1.XML声明:<?xml version="1.0" encoding="UTF-8" standalone="yes" ?>

version 表示版本,encoding表示编码,standalone表示该XML文件是否与其他文件关联使用(yes表示不关联使用,默认是no:可关联使用)。

2.处理指令:<?Processing_Instruction_target    Processing_Instruction_Information>

处理指令可以不遵守XML语法规则,是用来处理XML文档的应用程序提供信息的,XML解析器将其原封不动的交给应用程序处理。

比如在XML文档中,有可能包含一些非XML格式的数据(如:样式表),这些数据XML处理器无法处理,我们就可以通过处理指令来通知其他应用程序来处理这些数据,如:

<?xml-stylesheet  href="hello.css"  type="text/css"?>  ,其中"xml-stylesheet"叫做处理指令的目标,它必须标识到用到的应用程序

3.注释:<!--注释的内容 -->,注释是对文档结构或内容的解释,他们不属于XML文档的内容,XML解析器不会处理他们。

4.字符和实体引用:类似HTML中的 &nbsp; 这种东东,XML五个字符实体引用:

          实体              实体引用                  意义            
             lt            &lt;             <(小于号)            
             gt            &gt;             >(大于号)
             amp            &amp;             &(和)
            apos            &apos;             ' (单引号)
            quot                  &quot;                 " (双引号)

5.CDATA区:类似于HTML中的<pre></pre>标签的作用,在CDATA区内,所有的标记和实体引用都被忽略,而被XML处理程序一视同仁地当作字符数据对待。当需要在XML文档中显示包含标记的文本时,就可用CDATA区。CDATA区的使用形式如下:<![CDATA[ 内容 ]]>。注意:CDATA区不能嵌套使用

6.元素:XML文件的主要结构,一个元素就代表一项信息。元素通常包括 元素名称、开始标记、属性、文本内容、结束标记。

<elementName attlName="att1Value" att2Name="att2Value" ... />或<elementName ...>文本内容</elementName>

四、XML命名空间

1.什么是XML命名空间:类似于C#中的命名空间,是XML文档中添加在同名元素前的标识符,用于区分不同意义的同名元素,当然任何元素前都可以添加命名空间用以区分同类元素集合,任何合理的唯一的字符串都可以做XML命名空间,如统一资源定位符(URI)、统一资源名称(URN)、全局唯一标识符(UUID)、全球唯一标识符(GUID)等等。

2.XML命名空间的作用:区分不同意义的同名的元素,防止同名元素解析错误

3.使用方法:<namespacePrefix:elementName xmlns:namespacePrefix="命名空间">...</namespacePrefix:elementName>

其中的namespacePrefix叫做命名空间前缀,是代表该命名空间的一个字符串,这样写能够避免长度较大的命名空间写在元素前头影响解析和阅读。

4.作用范围:命名空间都是在某个元素内声明的,而它的作用范围就是该元素。该元素以及它的子元素中没有其他限定的元素都可以引用这个命名空间。

五、XML常用的两种解析机制

    

     1.DOM

DOM即文档对象模型,基于DOM的XML解析器会将XML文档转换为一个对象模型的集合(即DOM树)加载在内存,应用程序就是通过操作DOM树来实现对XML文档任意数据进行随机操作的,利用DOM接口的机制也称作随机访问机制。

DOM四个基本接口:①Document接口:对文档进行操作的入口,继承于Node接口;②Node接口:其他接口的父类;③NodeList接口:一个节点的集合,包含该节点的所有子节点;④NamedNodeMap接口:一个节点的集合,通过该接口,可以建立节点与节点之间的一一映射的关系,从而用节点名可以直接访问特定的节点。

优点:操作随机性、灵活性

缺点:当XML文档内容较大时,对内存的需求很高,且操作效率低下

     2.SAX

       SAX,XML简单应用程序接口,即事件驱动接口,SAX会从头到尾顺序解析整个XML文档,当遇到一个节点的开始或结束时,会触发事件,并激活相应的事件处理函数,应用程序通过这些事件处理函数实现对XML文档的访问。SAX提供的是顺序访问机制,对于已经分析过的部分,不能再倒回去重新处理,SAX分析器只是顺序的检查XML文档中的字节流,判断当前字节的合法性,再触发事件,而事件处理函数本身是由应用程序来实现的。

优点:对内容较多的XML文档解析效率高

缺点:只适合对XML文档进行"读"的操作,不适合"写“,操作缺乏灵活性

        

      

XML初学笔记的更多相关文章

  1. XML学习笔记

    XML学习笔记 第一部分:XML简介 我们经常可以听到XML.HTML.XHTML这些语言,后两者比较清楚,一直不是很明白XML是什么,这里做一个总结. XML(eXtensible Markup L ...

  2. mybatis-config.xml简单笔记

    mybatis-config.xml简单笔记 <?xml version="1.0" encoding="UTF-8"?> <!DOCTYPE ...

  3. applicationContext.xml简单笔记

    applicationContext.xml简单笔记 <?xml version="1.0" encoding="UTF-8"?> <bean ...

  4. C++ STL初学笔记

    C++  STL初学笔记 更系统的版本见徐本柱的PPT set 在这儿:http://www.cnblogs.com/pdev/p/4035020.html #include <vector&g ...

  5. Spring 初学笔记

    Spring 初学笔记: https://blog.csdn.net/weixin_35909255/article/category/7470388

  6. delphi操作xml学习笔记 之一 入门必读

    Delphi 对XML的支持---TXMLDocument类       Delphi7 支持对XML文档的操作,可以通过TXMLDocument类来实现对XML文档的读写.可以利用TXMLDocum ...

  7. laravel 5.6初学笔记

    laravel 5.6初学笔记 http://note.youdao.com/noteshare?id=bf4b701b49dd035564e7145ba2d978b4 框架简介 laravel文档齐 ...

  8. csapp网络编程初学笔记

    csapp网络编程初学笔记 客户端-服务器编程模型 每个网络应用都是基于客户端-服务器模型,服务器管理某种资源,并且通过操作来为它的客户提供某种服务 客户端-服务器模型中的基本操作是transacti ...

  9. Python初学笔记之字符串

    一.字符串的定义 字符串是就一堆字符,可以使用""(双引号).''(单引号)来创建. 1 one_str = "定义字符串" 字符串内容中包含引号时,可以使用转 ...

随机推荐

  1. 《Android群英传》读书笔记 (2) 第三章 控件架构与自定义控件详解 + 第四章 ListView使用技巧 + 第五章 Scroll分析

    第三章 Android控件架构与自定义控件详解 1.Android控件架构下图是UI界面架构图,每个Activity都有一个Window对象,通常是由PhoneWindow类来实现的.PhoneWin ...

  2. 解决下载android sdk慢的问题

    修改host文件 203.208.46.146 dl.google.com 203.208.46.146 dl-ssl.google.com 强制不使用https访问 在sdk manager里选择t ...

  3. 【开源java游戏框架libgdx专题】-12-开发工具-图片合成

    TexturePackerGui工具: 1.工具使用: 首先看到texturepacker的界面 界面介绍: New pack:创建项目按钮,单击后输入文件名称,创建文件. Input directo ...

  4. SQL DMO のDMV

    这两天对公司的一个项目进行优化,看着长长的SQL,脑袋不经有些大,一时间竟然不知道如何下手,一顿手忙脚乱后,小有成效,响应速度快了不少,同样的条件下可以做到秒级响应.闲暇时间想了想,还是得做点功课,最 ...

  5. iOS开发知识点:理解assign,copy,retain变strong

    一..h和.m文件的变化说明 1.对于.h头文件,主要是将属性定义由retain变为strong @property (retain, nonatomic) 变为 @property (strong, ...

  6. 浅谈C++ Lambda 表达式(简称LB)

    C++ 11 对LB的支持,对于喜欢Functional Programming的人来说,无疑是超好消息.它使得C++进入了和C#,JavaScript等现代流行的程序设计语言所代表的名人堂. 不熟悉 ...

  7. MTP设备无法安装驱动的解决办法

    1,进入设备管理器右击带黄色问号的MTP,选择“属性”,“详细信息”“设备范例 ID”(用Ctrl+C复制). 2,找到c:\windows\inf\wpdmtp.inf打开(或者通过运行打开),找到 ...

  8. Static Class (静态类)

    一般情况下是不可以用static修饰类的.如果一定要用static修饰类的话,通常static修饰的是匿名内部类. 在一个类中创建另外一个类,叫做成员内部类.这个成员内部类可以静态的(利用static ...

  9. 人民币符号¥在css和html正确显示

    商城项目需要涉及到人民币的页面现实问题.但是¥(指的是通常输入法中文全角模式下按shift+4的那个)在宋体(v3.03, v5.0)的情况下是显示一杠.常见的其他字体微软雅黑(Microsoft Y ...

  10. python of zip moudle

    reprinted:http://www.cnblogs.com/beginman/archive/2013/03/14/2959447.html A. code talk is cheap ,sho ...