一、Java DOM 的 API:

1.解析器工厂类：DocumentBuilderFactory

创建的方法：DocumentBuilderFactory dbf = DocumentBuilderFactory.newInstance();

2.解析器：DocumentBuilder

创建方法：通过解析器工厂类来获得 DocumentBuilder db = dbf.newDocumentBuilder();

3.文档树模型Document

创建方法：a.通过xml文档 Document doc = db.parse("bean.xml"); b.将需要解析的xml文档转化为输入流 InputStream is = new FileInputStream("bean.xml");

Document doc = db.parse(is);

Document对象代表了一个XML文档的模型树，所有的其他Node都以一定的顺序包含在Document对象之内，排列成一个树状结构，以后对XML文档的所有操作都与解析器无关，

直接在这个Document对象上进行操作即可；

二、DOM介绍优缺点分析

　　DOM: Document Object Model 文档对象模型。

　　在应用程序中，基于DOM的XML分析器将一个XML文档转换成一个对象模型的集合（通常称DOM树），应用程序通过对这个对象模型的操作，来实现对XML文档数据的操作。

　　通过DOM接口，应用程序可以在任何时候访问XML文档中的任何一部分数据，因此，这种利用DOM接口的机制也被称作随机访问机制。

　　DOM树所提供的随机访问方式给应用程序的开发带来了很大的灵活性，它可以任意地控制整个XML文档中的内容。

　　然而，由于DOM分析器把整个XML文档转化成DOM树放在了内存中，因此，当文档比较大或结构比较复杂时，对内存的需求就比较高。

　　而且，对于结构复杂的树的遍历也是一项耗时的操作。

　　所以，DOM分析器对机器性能的要求比较高，实现效率不十分理想。

　　由于DOM分析器所采用的树结构的思想与XML文档的结构相吻合，同时鉴于随机访问所带来的方便，因此，DOM分析器还是有很广泛的应用价值的。

DOM的组成

　　对于XML应用开发来说，DOM就是一个对象化的XML数据接口，一个与语言无关、与平台无关的标准接口规范。

　　DOM定义了HTML文档和XML文档的逻辑结构，给出了一种访问和处理这两种文档的方法。

　　文档代表的是数据，而DOM则代表了如何去处理这些数据。

　　作为W3C的标准接口规范，目前，DOM由三部分组成，包括：核心（core）、HTML接口和XML接口。

　　核心部分是结构化文档比较底层对象的集合，这一部分所定义的对象已经完全可以表达出任何HTML和XML文档中的数据了。

　　HTML接口和XML接口两部分则是专为操作具体HTML文档和XML文档所提供的高级接口。

<?xml version="1.0" encoding="utf-8"?>

<bookstore>

    <book category="children">

          <title lang="en">Harry Potter</title>

          <author>J K. Rowling</author>

          <year>2005</year>

          <price>29.99</price>

    </book>

    <book category="cooking">

          <title lang="en">Everyday Italian</title>

          <author>Giada De Laurentiis</author>

          <year>2005</year>

          <price>30.00</price>

    </book>

    <book category="web">

          <title lang="en">Learning XML</title>

          <author>Erik T. Ray</author>

          <year>2003</year>

          <price>39.95</price>

    </book>

    <book category="web">

          <title lang="en">XQuery Kick Start</title>

          <author>James McGovern</author>

          <author>Per Bothner</author>

          <author>Kurt Cagle</author>

          <author>James Linn</author>

         <author>Vaidyanathan Nagarajan</author>

          <year>2003</year>

          <price>49.99</price>

    </book>

</bookstore>

　　要严格区分XML文档树中的根节点与根元素节点：

　　文档（根节点）和根元素节点是两回事。

　　根节点代表整个文档，是我们解析XML文档的入口，通过它获取到Document对象；

　　根元素节点代表XML文档的根元素，必须要在获得Document对象之后才能一层一层地去访问它的元素。

DOM模型结构

　　最常见的节点类型：

　　元素：元素是XML的基本构建。

　　元素可以有其他元素、文本节点或两者兼有来作为其子节点。

　　元素节点还是可以有属性的唯一类型的节点。

　　属性：属性节点包含关于元素节点的信息，但实际上，不认为它是元素的子节点。

　　文本：确切来讲，文本节点是文本。它可以包含许多信息或仅仅是空白。

　　文档（根节点） ：文档节点是整个文档中所有其他节点的父节点。（根节点不等于根元素节点）。

　　较不常见的节点类型：CDATA、注释、处理指令。

DOM的四个基本接口

　　在DOM接口规范中，有四个基本的接口：Document, Node, NodeList, NamedNodeMap。

Document

　　Document接口是对文档进行操作的入口，它是从Node接口继承过来的。

Node

　　Node接口是其他大多数接口的父类。

　　在DOM树中，Node接口代表了树中的一个节点。

NodeList

　　NodeList接口是一个节点的集合，它包含了某个节点中的所有子节点。

　　它提供了对节点集合的抽象定义，并不包含如何实现这个节点集的定义。

　　NodeList用于表示有顺序关系的一组节点，比如某个节点的子节点序列。

　　在DOM中，NodeList的对象是live的，对文档的改变，会直接反映到相关的NodeList对象中。

NamedNodeMap

　　NamedNodeMap接口也是一个节点的集合，通过该接口，可以建立节点名和节点之间的一一映射关系，从而利用节点名可以直接访问特定的节点，这个接口主要用在属性节点的表示上。

　　尽管NamedNodeMap所包含的节点可以通过索引来进行访问，但是这只是提供了一种枚举方法，NamedNodeMap所包含的节点集中节点是无序的。

　　与NodeList相同，在DOM中，NamedNodeMap对象也是live的。

java_XML_DOM1的更多相关文章

随机推荐

jquery中:input和input的区别分析
:input表示选择表单中的input,select,textarea,button元素,input仅仅选择input元素. <html> <head> <style&g ...
JS表单原生验证器
一.前言最近在开发一个新项目,需要做登陆等一系列的表单提交页面.在经过“缜密”的讨论后,我们决定不用外部流行的框架,如bootstrap,由于我负责的模块仅仅是其中的一部分,因此少数服从多数,无 ...
Struts2实现异步调用机制详细剖析（XML和JSON）
一.使用XML传递 1.页面展示getXML.jsp <%@ page language="java" import="java.util.*" page ...
CodeForces 652C Foe Pairs
只要计算每个位置最多能到哪个位置,累加即可,DP从后往前预处理一下每个位置到达的最远位置. 有坑点:输入的时候如果同一个点出发的,需要保存最小值. #include<cstdio> #in ...
【转】Linux正则表达式使用指南
正则表达式是一种符号表示法,用于识别文本模式.Linux处理正则表达式的主要程序是grep.grep搜索与正则表达式匹配的行,并将结果输送至标准输出. 1. grep匹配模式 grep按下述方式接受选 ...
Leetcode 182. Duplicate Emails
Write a SQL query to find all duplicate emails in a table named Person. +----+---------+ | Id | Emai ...
关于《master opencv with practical computer vision projects》的源代码
很多读者都在向我要<master opencv with practical computer vision projects>的源代码,现向读者公布,具体源代码地址如下: https:/ ...
PHP快速按行读取CSV大文件的封装类分享（也适用于其它超大文本文件）
CSV大文件的读取已经在前面讲述过了(PHP按行读取.处理较大CSV文件的代码实例),但是如何快速完整的操作大文件仍然还存在一些问题. 1.如何快速获取CSV大文件的总行数? 办法一:直接获取文件内容 ...
10.TCP连接的建立与终止
1.建立连接协议 (1)请求端发送一个SYN段指明客户打算连接的服务器的端口,移机初始序号ISN.这个SYN段为报文段1. (2)服务器发回包含服务器的初始序号的SYN报文段作为应答.同时,将确认 ...
Js把IE COM数组列表转换成数组
今天写组件的时候遇到一个问题,就是当我需要对获取到的对象列表进行删减的时候,发现没有合适的方法,比如: //获取图片列表 var imgs = document.getElementsByTagNam ...

java_XML_DOM1