本节要点:

  • 了解XML的约束模式
  • 了解DTD
  • 了解Schema

了解XML的约束模式

计算机程序在处理XML文档之前,必须能够解析出XML文档的内容中各个元素的相关信息。将解析出来的信息再交给下游程序进行下一步处理。Parser就是用于解析XML文档的解析器程序,Parser可以独立使用,也可以成为编辑软件或浏览器的一部分。

所以XML文档必须严格遵循一定的语法,遵守XMl基本语法规则和规范的XML文档就称为Well-formed XML。一个XML文档必须是格式良好的,并且内容满足某些条件的约束。

约束模式是一套规则,对XML文档中的内容作出限制。约束模式定义了XML文档中允许出现的元素名,元素中的属性,内容类型,及元素间的嵌套关系和出现顺序。约束模式通常都在一个单独的文件中进行定义。约束模式的内容也需要遵循一定的语法规则,使用XML约束模式语言来定义XML约束模式的语法规则,模式文档采用某种约束模式语言编写如:XML DTD、XDR、SOX、XML Schema等,应用最广泛和具有代表意义的是XML DTD和XML Schema。

DTD

XML DTD(Document Type Definition 文档类型定义)

  • 最早出现的一种XML约束模式语言
  • 目前使用最广泛的一种XML约束模式
  • 以.dtd为扩展名
  • Struts使用较多

有效的XML必须遵循XML 的基本语法规则,且符合为它指定的某个XML约束模式的XML文档。校验是将一个XML文档和它所引用的XML约束模式进行比较分析,看其中的内容是否符合XML约束模式的过程。

2.1 DTD语法

l DTD(document type definition):文档类型定义

l 作用:约束XML的书写规范

1.一个简单例子

book.xml

<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE books SYSTEM "../dtd/books.dtd">
<books>
<book>
<author>张三</author>
<title>一本好书</title>
<price>20.00</price>
</book>
</books>

books.dtd

<!ELEMENT books (book+)>
<!ELEMENT book (author,title,price)>
<!ELEMENT author (#PCDATA)>
<!ELEMENT title (#PCDATA)>
<!ELEMENT price (#PCDATA)>

注:元素和子元素属性之间有空格分隔,如author  (#PCDATA)

1) 元素声明语法

语法格式:

<!ELEMENT 元素名称 使用规则>

使用规则:

定义元素中包含的组成部分,以及每种组成成分出现的次数、次序,还可以是某些成分进行某种关系组合后出现的次数、次序。

元素通配符使用

元字符

含义

+

出现一次或多次

*

出现零次或多次

可选,不出现或出现一次

(  )

一组要共同匹配的表达式

|

或(OR)

元素A, 元素B, 元素C

元素之间以逗号分割,要求严格遵从顺序要求

元素A  元素B  元素C

元素之间以空格分割,无须遵从顺序要求

示例:

(book+):表示books元素中可以包含一个或多个book元素

(title,author,price)

  • 表示book元素中要嵌套title、author、price子元素,并且这些子元素要按顺序依次出现,只能出现一次
  • 如果没有“,”隔开,表示各子元素可以任意次序出现,但必须且只能出现一次
  • 如果使用“|”隔开,表示只能出现它们之中的任何一个

(#PCDATA)

用于表示元素中的内容是普通文本字符串。

2) 属性声明语法

语法格式:

<!ATTLIST 标签名 属性列表 属性类型 出现方式>

“出现方式”设置

设置

描述

#REQUIRED

表示这个属性是必须的

#IMPLIED

表示这个属性的值是可选的

#FIXED

表示这个属性有一个固定的不能更改的值

默认

表示这个属性有一个默认值

“属性类型”设置

设置

描述

CDATA

文本类型

Enumerated

一个字符串值得枚举,表示可以任选其中一个

ID

表示唯一标示符(注:由ID表示的属性不能以数字开头)

ENTITY

一个外部实体(现在的浏览器不支持)

示例:

books.dtd

<!ELEMENT books (book+)>

<!ELEMENT book ((author,title,price)|comment+)>

<!ELEMENT author (#PCDATA)>

<!ELEMENT title (#PCDATA)>

<!ELEMENT price (#PCDATA)>

<!ATTLIST comment

author CDATA #IMPLIED

title CDATA #REQUIRED

price CDATA #IMPLIED

language CDATA #FIXED "Chinese"

type (java|.net|oracle) "java"

id ID #REQUIRED

>

Books.xml

<?xml version="1.0" encoding="UTF-8"?>

<!DOCTYPE books SYSTEM "books.dtd">

<books>

<book>

<author>joy</author>

<title>java core</title>

<price>100</price>

</book>

<book>

<comment id="S001" author="joy" title="Java" price="20" language="Chinese" />

<comment id="S002" author="joy" title="Java" price="20" language="Chinese" />

</book>

</books>

2.2 引入外部DTD文件

使用文档类型声明DOCTYPE语句引入DTD。格式如下:

<!DOCTYPE 文档类型名称 SYSTEM “DTD文件的URL”>

<! DOCTYPE 文档类型名称 PUBLIC “DTD名称” “DTD文件的URL”>

注:

  • 文档类型名称由编写者自己定义,通常是使用XML文档的根元素名称作为文档类型名称
  • SYSTEM表示XML文档所遵循的是一个本地或者组织内部所编写和使用的DTD文件
  • PUBLIC表示XML文档遵循的是一个由权威机构制定的,公开提供给特定行业或公众使用的DTD文件
  • “DTD名称”需要使用双引号括起来,应该符合一些标准的规定
  • SYSTEM 后面的“DTD文件的URL”可以是相对URL,也可以是绝对URL;PUBLIC 后面的“DTD文件的URL” 指定DTD文件在Internet上的绝对URL
  • <!DOCTYPE struts PUBLIC "-//Apache Software Foundation//DTD Struts Configuration 2.3//EN" "http://struts.apache.org/dtds/struts-2.3.dtd">中:

ü “-” 表示ISO标准的DTD,“+”被改进的非ISO标准的DTD,“-”未被改进的非ISO标准的DTD

ü “Apache Software Foundation”表示 DTD所有者的名称

ü “DTD Struts Configuration 2.3”表示DTD所描述的文件的说明

ü “EN“表示DTD语言的种类

2.3 嵌入DTD定义语句

可以在XML中嵌入使用DTD。

Schema

XML Schema

  • 对XML文档内容进行约束的另外一种模式
  • 目的是为了克服DTD的局限性,为XML提供丰富的语法结构
  • XML Schema已经成为W3C的正式推荐标准
  • 以.xsd为扩展名

XML Schema VS DTD:

  • XML Schema符合XML语法结构。
  • DOM、SAX等XML API很容易解析出XML Schema文档中的内容。
  • XML Schema对名称空间支持得非常好。
  • XML Schema比XML DTD支持更多的数据类型,并支持用户自定义新的数据类型。
  • XML Schema定义约束的能力非常强大,可以对XML实例文档作出细致的语义限制。
  • XML Schema不能像DTD一样定义实体,比DTD更复杂,但Xml Schema现在已是w3c组织的标准,它正逐步取代DTD。

schema的基础是数据类型,理解schema的最好方式是将它看成是数据类型的层次结构,在层次结构的底层是内置的不可再划分的数据类型,如:整数、字符串、浮点数、日期等,表示xml文件可能包含的数据的基本单元。通过组合这些简单的数据类型,可以创建出各种不同的复杂数据类型,然后可以使用这些数据类型来定义元素和属性。这样,你将为xml文档的根元素、子元素、一直到最底层的包含文档数据的元素定义数据类型,因此,学习创建xsd schema,大体上就成了一个定义数据类型的过程。

XML约束(3)的更多相关文章

  1. XML约束之DTD

    XML文件的约束:什么叫约束呢?顾名思义,就是对xml文件的内容进行按照既定规则的限制.我们知道,因为xml文件的标签是可以自定义的,而往往我们用xml文件都是为了表达一定的数据集合(即小型的数据库) ...

  2. JAVA基础学习之XMLCDATA区、XML处理指令、XML约束概述、JavaBean、XML解析(8)

    1.CDATA区在编写XML文件时,有些内容可能不想让解析引擎解析执行,而是当作原始内容处理.遇到此种情况,可以把这些内容放在CDATA区里,对于CDATA区域内的内容,XML解析程序不会处理,而是直 ...

  3. XML约束——DTD约束

    参考: 方立勋老师的讲课视频.   什么是XML约束 •在XML技术里,可以编写一个文档来约束一个XML文档的书写规范,这称之为XML约束. 为什么需要XML约束 常用的约束技术 •XML DTD • ...

  4. 二、XML约束

    XML约束有dtd约束和Schema约束两种 dtd约束:可以在xml内部写dtd约束也可以在xml中引用外部dtd文件 book.dtd<!ELEMENT 书架 (书+)>    < ...

  5. javaweb学习总结八(xml约束DTD)

    一:XML约束概念 xml约束:可以编写一个文档来约束xml文件的书写规范. xml语言格式比较严谨,不可能让程序员随意编写,所以必须要有约束. 二:常用的xml约束技术 1:DTD,document ...

  6. JavaBean 内省API BeanUtils工具 泛型 xml xml约束

    1 什么是JavaBean?有何特征? 1)符合特定规则的类    2)JavaBean分二类:     a)侠义的JavaBean         .私有的字段(Field)         .对私 ...

  7. XML约束

    XML约束--能够看懂约束内容,根据约束内容写出符合规则的xml文件. DTD约束 1)导入dtd方式 内部导入 <!DOCTYPE note [ <!ELEMENT note (to,f ...

  8. xml约束的概念

    1 xml 约束的概念 XML 指可扩展标记语言(EXtensible Markup Language) XML 是一种标记语言,很类似 HTML XML 的设计宗旨是传输数据,而非显示数据 XML ...

  9. xml约束技术之dtd

    DTD(文档类型定义)的作用是定义 XML 文档的合法构建模块.这篇文章作简单介绍下DTD的用法.想学习完整的请点击下面w3c的教程. 1.DTD官方教程 ##2.xml约束技术: DTD约束:语法相 ...

随机推荐

  1. 一起写框架-Ioc内核容器的实现-基础功能-容器对象名默认首字母小写(八)

    实现功能 --前面实现的代码-- 默认的对象名就类名.不符合Java的命名规范.我们希望默认的对象名首字母小写. 实现思路 创建一个命名规则的帮助类.实现将对大写开头的对象名修改为小写开头. 实现步骤 ...

  2. MongoDB安装(windows 10环境)

    1. 下载 https://www.mongdb.com/ 选择版本:ws 2008 R2 64bit 2. 安装运行下载完成的MSI文件 安装时候选择自定义配置,选择安装路径,安装到E盘 等待2分钟 ...

  3. 对SQL Server事务的4个隔离级别的理解

    事务隔离级别的简单理解   ANSI/ISO SQL标准定义了4种事务隔离级别,这些隔离级别是根据事务并行出现的4个"现象"定义的. 4个现象是: 1.更新丢失(Lost Upda ...

  4. Espresso浅析和使用

    欢迎大家前往腾讯云社区,获取更多腾讯海量技术实践干货哦~ Espresso是一个Google官方提供的Android应用UI自动化测试框架.Google希望,当Android的开发者利用Espress ...

  5. Unity3D游戏xlua轻量级热修复框架

    这是什么东西 前阵子刚刚集成xlua到项目,目的只有一个:对线上游戏C#逻辑有Bug的地方执行修复,通过考察了xlua和tolua,最终选择了xlua,原因如下: 1)项目已经到了后期,线上版本迭代了 ...

  6. linux如何在日志中查找关键字、前几行、结尾几行

    如何使用命令行快速查看项目日志是每个开发人员必备技能,尤其在没有专门日志搜集系统的情况下,想要知道目前项目运行状态最好的办法就是打开log日志一瞅即明白. 复杂的到用时再查不晚,但是简单的还是有必要掌 ...

  7. laravel 500错误的一个解决办法

    我从svn上update下来了开发环境的目录,结果当我访问本地的根目录的时候却报了500错误,百度了许多,也看了很多博客,发现都没有解决我的问题,所以我觉得我的解决办法值得一写,当你从svn上upda ...

  8. 在没有DOM操作的日子里,我是怎么熬过来的(中)

    前言 继上篇推送之后,在掘金.segmentfault.简书.博客园等平台上迅速收到了不俗的反馈,大部分网友都留言说感同身受,还有不少网友追问中篇何时更新.于是,闰土顺应呼声,在这个凛冽的寒冬早晨,将 ...

  9. python requests抓取NBA球员数据,pandas进行数据分析,echarts进行可视化 (前言)

    python requests抓取NBA球员数据,pandas进行数据分析,echarts进行可视化 (前言) 感觉要总结总结了,希望这次能写个系列文章分享分享心得,和大神们交流交流,提升提升. 因为 ...

  10. 边框(Border) 和 轮廓(Outline) 属性

    border 复合属性.设置对象边框的特性. 标签定义及使用说明 如果上述值缺少一个没有关系,例如border:#FF0000;是允许的. 默认值: not specified 继承: no Java ...