ch2 XML

有两种XML文档结构,DTD和Schema,用解释文档构成规则,这些规则指定了每个元素俺的合法子元素和属性。

DTD

DTD有多种提供方式,可以像下面这样加到XML中:

<?xml version="1.0"?>

<!DOCTYPE configuration [    //文档类型必须匹配根元素的名字

  <!ELEMENT configuration ...>

  more rules

  ...

]>

<configuration>    //根元素

  ...

</configuration>

当然,直接在XML中提供DTD不常用,更常用的方式是DTD放在外面。用SYSTEM声明。

<!DOCTYPE configuration SYSTEM "config.dtd"> //相对于当前XML文档的路径,因为是相对路径,解析器要能够定位,要么是File或Url对象,要么是InputStream加实体解析器来定位。

<!DOCTYPE configuration SYSTEM "http://myserver.com/config.dtd">

还有一种所谓的“总所周知”的DTD机制:

<!DOCTYPE web-app

  public "-//Sun Microsystems, Inc.//DTD Web Application 2.2//EN"   //publicId

  "http://java.sun.com/j2ee/dtds/web-app_2_2.dtd">  //systemId

如果解析器能定位public,就不需要http那段了

然后书中给了一段代码和一句洋文翻译过来的话,“如果你使用的是DOM解析器,并且想要支持PUBLIC标识符,请调用DocumentBuilder类的setEntityResolver方法来安装EntityResolver接口的某个实现类的一个对象”。

啥叫支持public标识符?难道是上面的public "-//Sun ...?看样子是的。

class MyEntityResolver implements EntityResolver{  //EntityResolver的实现类

  public InputSource resolveEntity(String publicID, String systemID){

    if(publicID.equals(a known ID)){

      return new InputSource(DTD data);  //这里就是支持public标识符的设置了吧,简单的说就是解析器能够通过public标识符来定位其指定的DTD文档  

    }else{

      return null;

    }

  }

}

真TM绕口,直接看下JDK DocumentBuilder的方法说明:

  setEntityResolver(EntityResolver er) //EntityResolver接口的某个实现类的一个对象

Specify the EntityResolver to be used to resolve entities present in the XML document to be parsed.

明白了。

然后我们就知道,DTD是通过上面这些方式来定位了。

好了,接下来说说具体的。ELEMENT规则用于指定某个元素有什么样的子元素,可以是正则表达式。

<!ELEMENT menu (item)*>   //menu元素包含0或多个item元素

<!ELEMENT font (name,size)>

<!ELEMENT name (#PCDATA)>

<!ELEMENT size (#PCDATA)>

<!ELEMENT chapter (intro, (heading, (para|image|table|note)+)+) //元素嵌套

包含被解析文本#PCDATA的规则有两种,只包含文本、文办加标签:

<!ELEMENT para (#PADATA)>

<!ELEMENT para (#PADATA|em|strong|code)*>

非法的例子:

<!ELEMENT para (image,#PCDATA)>

------------------------------------------------------

描述元素属性的语法规则:

<!ATTLIST element attribute type default>

典型例子:

<!ATTLIST font style (plain|bold|italic|bold-italic) "plain">   //style属性,有4个值,默认为plain

<!ATTLIST size unit CDATA #IMPLIED>  //这里的CDATA与前面XML中的<![CDATA[...]>是没关系的,这里指任意字符串

DTD实体的定义与引用:

<!ENITY back.label "Back">

<menumitem label="&back.label;"/>

DTD介绍完毕。

用法:

factory.setValidating(true);   //启用DTD验证

factory.setIgnoringElementWhitespace(true);  //去掉空格验证

Java核心技术II读书笔记(二)的更多相关文章

  1. Java核心技术II读书笔记(三)

    ch2 XML SAX解析器 SAXParserFactory factory = SAXParserFactory.newInstance(); SAXParser parser = factory ...

  2. Java核心技术II读书笔记(一)

    Char2 XML 解析器:读入一个文件,确认其具有正确的格式,然后将其分解成各种元素,使程序员能够访问这些元素. java库提供了两种XML解析器:DOM和SAX,即文档对象模型和流机制解析器. D ...

  3. 深入理解Java虚拟机之读书笔记二 垃圾收集器

    1.对象已死? a.引用计数算法:缺点是它很难解决对象之间的相互循环引用的问题,Java语言中没有选用它. b.根搜索算法(GC Roots Tracing):通过一系列的名为"GC Roo ...

  4. 《Java核心技术》 -- 读书笔记 ② - 类 | 对象 | 接口

    对象vs对象变量 “对象” 描述的是一个类的具体实例,他被java虚拟机分配在 "堆" (Heap)中. “对象变量” 为一个对象的引用(对象变量的值=记载着具体对象的位置/地址) ...

  5. Java常用类库 读书笔记 二

    1.Date类 常用操作方法: public Date ()                         构造方法,实例化Date类对象 public Data(long Date)       ...

  6. 《Java核心技术》 -- 读书笔记 ① - 预热

    引言 之前通过网上的实例自己使用了Java的一些技术及轮子快速的的“烂“造了一些小应用,但是毕竟没有认真地了解和认知Java,遂打算花一个月左右的时间来细细品味一下... 从头开始,慢慢深入!! Ja ...

  7. Java逍遥游记读书笔记<二>

    Abstract抽象类 1.抽象类不能被实例化 2.抽象方法没有方法体 如: public abstract class Weapen { public abstract void attack(); ...

  8. 《深入理解java虚拟机》读书笔记二——第三章

    第三章 垃圾收集器与内存分配策略 1.判断对象是否已死 引用计数法: 给对象添加一个引用计数器,每当有一个地方引用它时,计数器值就加1,每当引用失效时,计数器值就减1. 任何时刻计数器为0的对象就是不 ...

  9. 《深入理解Java虚拟机》读书笔记二

    第三章 垃圾收集器与内存分配策略 1.判断对象是否已死 引用计数法: 给对象添加一个引用计数器,每当有一个地方引用它时,计数器值就加1,每当引用失效时,计数器值就减1. 任何时刻计数器为0的对象就是不 ...

随机推荐

  1. asp.net中Literal与label的区别

    Literal 控件表示用于向页面添加内容的几个选项之一.对于静态内容,无需使用容器,可以将标记作为 HTML 直接添加到页面中.但是,如果要动态添加内容,则必须将内容添加到容器中.典型的容器有 La ...

  2. 欧拉工程第52题:Permuted multiples

    题目链接 题目: 125874和它的二倍,251748, 包含着同样的数字,只是顺序不同. 找出最小的正整数x,使得 2x, 3x, 4x, 5x, 和6x都包含同样的数字. 这个题目相对比较简单 暴 ...

  3. for语句中声明变量

    在C语言中,局部变量应该在函数的可执行语句之前定义,但在C++中变量可在任何语句位置定义,只要允许程序语句的地方,都允许定义变量. 在C99标准中C同C++一样允许在for循环语句中定义变量.并且这个 ...

  4. 一个tomcat上放多个webapp问题,那这多个webapp会不会竞争端口呢?不会!安全两码事

    1.一个tomcat上放多个webapp问题,那这多个webapp会不会竞争端口呢?不会!安全两码事

  5. Qt通过UDP传图片,实现自定义分包和组包

    一.包头结构体 //包头 struct PackageHeader { //包头大小(sizeof(PackageHeader)) unsigned int uTransPackageHdrSize; ...

  6. Intellij编译时报“java: System Java Compiler was not found in classpath” 解决办法

    Intellij编译时报“java: System Java Compiler was not found in classpath” 解决方法: Project Settings > Comp ...

  7. lines---hdu5124(离散化+数组模拟)

    题目链接:http://acm.hdu.edu.cn/showproblem.php?pid=5124 就是有n条在x轴的线段,给你线段的左右端点,每条线段都会覆盖点,求出最多被覆盖多少次: #inc ...

  8. 《Linux内核设计与实现》读书笔记 - 目录 (完结)【转】

    转自:http://www.cnblogs.com/wang_yb/p/3514730.html 读完这本书回过头才发现, 第一篇笔记居然是 2012年8月发的, 将近一年半的时间才看完这本书(汗!! ...

  9. Python 脚本生成测试数据,Python生成随机数据,Python生成大量数据保存到文件夹中

    代码如下: import random import datetime import time dataCount = 10*100*100 #10M. codeRange = range(ord(' ...

  10. 《c程序设计语言》读书笔记--统计字符数

    #include <stdio.h> #define MAXLINE 1000 int getline(char line[],int maxline); void copy(char t ...