XML 文档包含元素和属性等,它们提供一种灵活且功能强大的方法,为应用程序和组织之间交换数据。所有的 XML 文档(以及 HTML 文档)均由以下简单的构建模块构成:
1、元素
元素是XML的主要构建模块,将xml数据划分为不同部分和语义的标签,如<note></note>
2、属性
属性可提供有关元素的额外信息,被置于元素的开始标签中,总是以名称/值的形式成对出现的。
<img src="computer.gif" />
元素的名称是 "img"。属性的名称是 "src"。属性的值是 "computer.gif"
3、名称空间   
类似于c#中的名称空间,用来隔离相同或不同的元素。
4、实体
实体是用来定义普通文本的变量,定义了一个变量等于某个字符串,然后在XML中就可以直接使用此变量,这个变量就叫做实体。
使用实体之前,必需先声时,声明语句位于xml文档的序言的内部子集中,实体声明必需使用大写方式,如:<!ENTITY myentity "这是一个实体"> ,ENTITY必需是大写的。使用实本时,在实体名称前面加上 & ,并表在后面加上分号:  ;。
<?xml version="1.0"?>
  <!DOCTYPE doc
   [
     <!ENTITY number "12345678">
   ]>
<message>
  <number>&number;</number>
</message>
解析后结果:
<message>
  <number>12345678</number>
</message>
5、注释
文档的注解
6、PCDATA
PCDATA 的意思是被解析的字符数据(parsed character data)。
可把字符数据想象为 XML 元素的开始标签与结束标签之间的文本。
PCDATA是会被解析器解析的文本。这些文本将被解析器检查实体以及标记。
文本中的标签会被当作标记来处理,而实体会被展开。
7、CDATA
CDATA 的意思是字符数据(character data)。在CDATA块中的字符将以原样输出
CDATA 是不会被解析器解析的文本。在这些文本中的标签不会被当作标记来对待,其中的实体也不会被展开。
8、处理指令

格式<?name data?>,负责与处理器进行交互,每种xml处理器都有一些命令开关。而处理器指令就是调用这些开关的。每个处理器的开关都不尽相 同。<?xml version="1.0" ?> 这个处理指令是每个xml处理器都支持的。

若要指定允许的结构和 XML 文档的内容,可以编写 DTD(Document Type Definition) 、XDR 架构中或 XSD 架构,来验证文档是否符合规范,元素和标签使用是否正确。
下面通过DTD来说明,DTD的写法分两种,既可写在同一个xml文件中,也可单独写在另一个文件中。
1、DTD写在同一个xml文件中:
Persons.xml

[html] view plaincopyprint?

  1. <?xml version="1.0" encoding="UTF-8"?>
  2. <!DOCTYPE Persons [ 
  3. <!ELEMENT Persons (Person+)>
  4. <!ELEMENT Person (Name,Age)>
  5. <!ELEMENT Name (#PCDATA)>
  6. <!ELEMENT Age (#PCDATA)>
  7. <!ATTLIST Persons xmlns:xsi CDATA #REQUIRED>
  8. <!ATTLIST Persons xmlns CDATA #REQUIRED>
  9. <!ATTLIST Person id CDATA #REQUIRED>
  10. ]>
  11. <Persons xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
  12. xmlns="http://www.xxx.com/XxxSystem">
  13. <Person id="1">
  14. <Name>张三</Name>
  15. <Age>18</Age>
  16. </Person>
  17. <Person id="2">
  18. <Name>李四</Name>
  19. <Age>20</Age>
  20. </Person>
  21. </Persons>

2、DTD单独写在另一个文件中,在xml文档中通过<!DOCTYPE Persons SYSTEM "Persons.dtd">去链接。
Persons.xml

[html] view plaincopyprint?

  1. <?xml version="1.0" encoding="UTF-8"?>
  2. <!DOCTYPE Persons SYSTEM "Persons.dtd">
  3. <Persons xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
  4. xmlns="http://www.xxx.com/XxxSystem">
  5. <Person id="1">
  6. <Name>张三</Name>
  7. <Age>18</Age>
  8. </Person>
  9. <Person id="2">
  10. <Name>李四</Name>
  11. <Age>20</Age>
  12. </Person>
  13. </Persons>

Persons.dtd

[html] view plaincopyprint?

  1. <!ELEMENT Persons (Person+)>
  2. <!ELEMENT Person (Name,Age)>
  3. <!ELEMENT Name (#PCDATA)>
  4. <!ELEMENT Age (#PCDATA)>
  5. <!ATTLIST Persons xmlns:xsi CDATA #REQUIRED>
  6. <!ATTLIST Persons xmlns CDATA #REQUIRED>
  7. <!ATTLIST Person id CDATA #REQUIRED>

以上 DTD 解释如下:
(1)
第2行定义此文档是 Persons 类型的文档。
第3行定义 Persons元素有一个以上子元素:"Person"
第4行定义 Person 元素为两个子元素"Name、Age" 类型
第5行定义 Name 元素为 "#PCDATA" 类型
第6行定义 Age 元素为 "#PCDATA" 类型
第7行定义 Persons 元素必须有属性xmlns:xsi(即命名空间)
第8行定义 Persons 元素必须有属性xmlns(即命名空间)
第9行定义 Persons 元素必须有属性id
(2)Person+的+代表此标记必须出现一次以上,常见:
? 不出现或只出现一次
*  不出现或可出现多次
+  必须出现一次以上
无符号 只能出现一次
(3)ELEMENT代表元素,ATTLIST代表属性,属性语法:
<!ATTLIST 元素名称 属性名称 属性类型 默认值>
属性的默认值
#REQUIRED 属性值是必需的
#IMPLIED 属性不是必需的
#FIXED value 属性值是固定的
C# 通过DTD验证XML文档方法。
参考了http://msdn.microsoft.com/en-us/library/z2adhb2f.aspx一文,做了一些改动。

[csharp] view plaincopyprint?

  1. /// <summary>
  2. /// 使用DTD验证xml文档格式
  3. /// </summary>
  4. /// <param name="filename">xml文件名</param>
  5. /// <returns>验证通过返回空字符串,否则返回错误提示信息</returns>
  6. public static string ValidXmlByDTD(string filename) 
  7.     StringBuilder sb = new StringBuilder(); 
  8.     XmlReaderSettings settings = new XmlReaderSettings(); 
  9.     settings.DtdProcessing = DtdProcessing.Parse; 
  10.     settings.ValidationType = ValidationType.DTD; 
  11.     settings.ValidationEventHandler += delegate(object ss, ValidationEventArgs ee) 
  12.     { 
  13.         sb.AppendFormat("{0}", ee.Message); 
  14.     }; 
  15. using (XmlReader reader = XmlReader.Create(filename, settings)) 
  16.     { 
  17. try
  18.         { 
  19. while (reader.Read()) ; 
  20.         } 
  21. catch (Exception ex) 
  22.         { 
  23. //DTD如果有错误,会提示无效的内容模型
  24. return "异常:" + ex.Message; 
  25.         } 
  26.     } 
  27. return sb.ToString(); 

 

原文地址:http://blog.csdn.net/gdjlc/article/details/10926229

XML组成结构以及C#通过DTD验证规范性的更多相关文章

  1. XML DTD验证

    XML DTD验证 一.什么是DTD 文档类型定义(DTD:Document Type Definition)可定义合法的XML文档构建模块.它使用一系列合法的元素来定义文档的结构. DTD 可被成行 ...

  2. xml基础之二(XML结构【2】)DTD文档模版

    xml基础之二(XML结构[2])DTD文档模版 xml 模板 文档结构  我们知道XML主要用于数据的存储和传输,所以无论是自定义还是外部引用DTD模板文档,都是为了突出数据的存储规范.DTD(文档 ...

  3. DTD验证XML(转)

    1.内部DTD       最简单的使用DTD的方法是在XML文件的序言部分加入一个DTD描述,加入的位置是紧接在XML处理指示之后.一个包含DTD的XML文件的结构为:    <?xml ve ...

  4. DTD验证XML文档

    DTD验证XML文档        1.DTD简介:DTD是Document Type Definition的缩写,即文档定义            1.1:DTD的内容包含:             ...

  5. dom4j解析xml时取消DTD验证

    解决方式整合一下,就分两种: 1.用setFeature() SAXReader reader = new SAXReader();reader.setValidation(false); reade ...

  6. XML学习笔记(二)-- DTD格式规范

    标签(空格分隔): 学习笔记 XML的一个主要目的是允许应用程序之间自由交换结构化的数据,因此要求XML文档具有一致的结构.业务逻辑和规则.可以定义一种模式来定义XML文档的结构,并借此验证XML文档 ...

  7. 16.XML语法、CDATA、约束(DTD、Schema)讲解

    xml主要用来描述数据,比如配置文件,网络之间传输数据等,并且在android中也经常用xml来布局,,接下来便来学习xml常用的东西 1.XML语法 xml语法分为: 1.1 文档声明 必须位于文档 ...

  8. XML、XSL、XSLT、DTD、XSD的区别

    前言: 在众神的努力之下,js已经可以跨出浏览器走向不同的领域了 也因为这个,对前端工程师的要求也不仅仅是会写写h5页面做交互.前端涉及的领域越来越广,对开发人员对素质能力要求越高. 以前因设备不同导 ...

  9. udp开发-dtd验证,dom解析

    //博主太懒了,并没有提供范例程序 6.基于UDP开发 (1)发送方:socket->准备数据包 DatagramSocket docket = new DatagramSocket(); // ...

随机推荐

  1. Spring @Scheduled应用解析

    最近,遇到的一个需求,需要执行定时任务,每个一定时间需要执行某个方法 因为项目是SpringMVC的项目,所以使用的是Spring @Scheduled(由于quartz应用起来太麻烦,所以没有采用) ...

  2. JS弹窗数据带回

    父窗口代码: function selectCar_Team_Info(){ //var url = "<%=basepath_%>ec/jsp/carLoading/carTe ...

  3. 一个android参考网站,工具+源码

    Android多渠道打包工具  https://github.com/wubo/apptools Android官方培训课程中文版(v0.9.4)  http://hukai.me/android-t ...

  4. FCKeditor编辑器如何使用

    转自 http://www.cnblogs.com/tylerdonet/archive/2013/04/20/3032980.html

  5. nodejs渲染模板

    为什么要用nodejs来渲染? 之前前端的任务就是用HTML+CSS 来高保真的还原UI所设计原图,偶尔会使用少量的jq来对页面添加一些特效,页面还要交付给后端开发人员进行数据填充(php jsp)等 ...

  6. DNS配置详解

    DNS简介在Linux中,域名服务(DNS)是由柏克莱网间名域(Berkeley Internet Name Domain——BIND)软件实现的.BIND是一个客户/服务系统,它的客户方面称为转换程 ...

  7. 几个常见的布局的多种实现方式及margin负值总结

    第一部分:几个常见的布局实现方式 一.左右两边固定, center中间自适应未知 html代码中 center 部分首先要放在box的最前部分.然后是left,right 圣杯布局: <div ...

  8. Caffe.proto使用

    参考 http://blog.csdn.net/qq_16055159/article/details/45115359 书写.proto文件 作用:编写一个 proto 文件,定义我们程序中需要处理 ...

  9. ASP.NET MVC中多种ActionResult用法总结

    最近一段时间做了个ASP.NET MVC4.0的项目,项目马上就要结束了,今天忙里偷闲简单总结一下心得: 1. 如果Action需要有返回值的话,必须是ActionResult的话,可以返回一个Emp ...

  10. Java - 处理某些图片泛红

    参考博文: http://blog.csdn.net/kobejayandy/article/details/44346809 http://blog.csdn.net/shixing_11/arti ...