• XML解析方式分为两种:dom和sax

        dom:(Document Object Model, 即文档对象模型) 是 W3C 组织推荐的处理 XML 的一种方式。
       sax: (Simple API for XML) 不是官方标准,但它是 XML 社区事实上的标准,几乎所有的 XML 解析器都支持它。

  • XML解析器

Crimson、Xerces 、Aelfred2

  • XML解析开发包

Jaxp、Jdom、dom4j

  • JAXP 开发包是J2SE的一部分,它由javax.xml、org.w3c.dom 、org.xml.sax 包及其子包组成
  • 在 javax.xml.parsers 包中,定义了几个工厂类,程序员调用这些工厂类,可以得到对xml文档进行解析的 DOM 或 SAX 的解析器对象。
  • DOM模型(document object model)

DOM解析器在解析XML文档时,会把文档中的所有元素,按照其出现的层次关系,解析成一个个Node对象(节点)。
在dom中,节点之间关系如下:

  • 位于一个节点之上的节点是该节点的父节点(parent)
  • 一个节点之下的节点是该节点的子节点(children)
  • 同一层次,具有相同父节点的节点是兄弟节点(sibling)
  • 一个节点的下一个层次的节点集合是节点后代(descendant)
  • 父、祖父节点及所有位于节点上面的,都是节点的祖先(ancestor)
  • javax.xml.parsers 包中的DocumentBuilderFactory用于创建DOM模式的解析器对象 ,

DocumentBuilderFactory是一个抽象工厂类,它不能直接实例化,

但该类提供了一个newInstance方法 ,这个方法会根据本地平台默认安装的解析器,自动创建一个工厂的对象并返回。

1.调用 DocumentBuilderFactory.newInstance() 方法得到创建 DOM 解析器的工厂对象。

 DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance();

2.调用工厂对象的 newDocumentBuilder方法得到 DOM 解析器对象。

 DocumentBuilder builder = factory.newDocumentBuilder();

3.调用 DOM 解析器对象的 parse() 方法解析 XML 文档,得到代表整个文档的 Document 对象,进行可以利用DOM特性对整个XML文档进行操作了。

 DocumentBuilder builder = factory.newDocumentBuilder();
  • Node对象提供了一系列常量来代表结点的类型,当开发人员获得某个Node类型后,就可以把Node节点转换成相应的节点对象(Node的子类对象),以便于调用其特有的方法。(查看API文档)
  • Node对象提供了相应的方法去获得它的父结点或子结点。编程人员通过这些方法就可以读取整个XML文档的内容、或添加、修改、删除XML文档的内容了。(如果Node对象没有对应的方法可以强制转换为Element等对象进行操作)
  • javax.xml.transform包中的Transformer类用于把代表XML文件的Document对象转换为某种格式后进行输出,例如把xml文件应用样式表后转成一个html文档。利用这个对象,当然也可以把Document对象又重新写入到一个XML文件中。
  • Transformer类通过transform方法完成转换操作,该方法接收一个源和一个目的地。我们可以通过:

      • transform(Source xmlSource, Result outputTarget)
      • javax.xml.transform.dom.DOMSource类来关联要转换的document对象,
      •   用javax.xml.transform.stream.StreamResult 对象来表示数据的目的地。

  • Transformer对象通过TransformerFactory获得。

 book1.xml:

<?xml version="1.0" encoding="utf-8" standalone="no"?>
<书架>
<书 name="xxxx">
<售价>55元</售价>
<书名>Java就业培训教程</书名>
<作者>张孝祥</作者>
</书>
<书>
<书名>JavaScript网页开发</书名>
<作者>张孝祥</作者>
<售价>28.00元</售价>
</书>
</书架>

 Demo1.java:

package wys.jaxp;

import java.io.File;
import javax.xml.parsers.DocumentBuilder;
import javax.xml.parsers.DocumentBuilderFactory;
import javax.xml.transform.Transformer;
import javax.xml.transform.TransformerFactory;
import javax.xml.transform.dom.DOMSource;
import javax.xml.transform.stream.StreamResult;
import org.junit.Test;
import org.w3c.dom.Document;
import org.w3c.dom.Element;
import org.w3c.dom.Node;
import org.w3c.dom.NodeList; public class Demo1 { public static void main(String[] args) throws Exception { // 获取工厂
DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance(); // 产生解析器
DocumentBuilder builder = factory.newDocumentBuilder(); // 解析xml文档,获取代表文档的document
Document document = builder.parse(new File("src/xml/book1.xml")); read(document); } // 读取指定节点值
public static void read(Document document) {
NodeList nodelist = document.getElementsByTagName("售价"); Node node = nodelist.item(0); String val = node.getTextContent(); System.out.println(val); } // 更新节点内容
public static void update() throws Exception {
DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance(); DocumentBuilder builder = factory.newDocumentBuilder(); Document document = builder.parse(new File("src/xml/book1.xml")); // 获取售价节点
Node price = document.getElementsByTagName("售价").item(0);
price.setTextContent("5555元"); TransformerFactory tfactory = TransformerFactory.newInstance();
Transformer tformer = tfactory.newTransformer(); tformer.transform(new DOMSource(document), new StreamResult(new File(
"src/xml/book1.xml"))); } // 向指定节点中增加子节点
public static void add() throws Exception { DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance(); DocumentBuilder builder = factory.newDocumentBuilder(); Document document = builder.parse(new File("src/xml/book1.xml")); // 创建一个售价节点在内存中
Node price = document.createElement("售价");
price.setTextContent("1888元"); // 获取要加入位置的父节点
Node shu = document.getElementsByTagName("书").item(0); // 把需要增加的节点挂到父节点上
shu.appendChild(price); // 将内存中的document写入xml文件,先用转换工厂得到转换器
TransformerFactory tf = TransformerFactory.newInstance();
Transformer transformer = tf.newTransformer(); transformer.transform(new DOMSource(document), new StreamResult(
new File("src/xml/book1.xml")));
} //向指定位置插入新的节点
@Test
public void add2() throws Exception { DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance(); DocumentBuilder builder = factory.newDocumentBuilder(); Document document = builder.parse(new File("src/xml/book1.xml")); Node price = document.createElement("售价");
price.setTextContent("指定位置:16元"); // 向指定节点之前插入新节点
Node shu = document.getElementsByTagName("书").item(0);
shu.insertBefore(price, document.getElementsByTagName("书名").item(0)); // 将内存中的document写入xml文件,先用转换工厂得到转换器
TransformerFactory tf = TransformerFactory.newInstance();
Transformer transformer = tf.newTransformer(); transformer.transform(new DOMSource(document), new StreamResult(
new File("src/xml/book1.xml"))); } @Test
//删除指定节点
public void delete() throws Exception { DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance();
DocumentBuilder builder = factory.newDocumentBuilder();
Document document = builder.parse(new File("src/xml/book1.xml")); // 获取要删除的节点,调用父节点删除(自己不能删除自己)
Node price = document.getElementsByTagName("售价").item(2);
price.getParentNode().removeChild(price); TransformerFactory tf = TransformerFactory.newInstance();
Transformer transformer = tf.newTransformer();
transformer.transform(new DOMSource(document), new StreamResult(
new File("src/xml/book1.xml")));
} // 操作xml文档属性
@Test
public void updateAttribute() throws Exception { DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance();
DocumentBuilder builder = factory.newDocumentBuilder();
Document document = builder.parse(new File("src/xml/book1.xml")); // Element继承自Node,Node没有操作属性的方法,操作节点属性需要强制转换为元素节点
Element shu = (Element) document.getElementsByTagName("书").item(0);
shu.setAttribute("name", "yyyyyyy");
shu.setAttribute("password", "12345678");
shu.removeAttribute("password"); TransformerFactory tf = TransformerFactory.newInstance();
Transformer transformer = tf.newTransformer();
transformer.transform(new DOMSource(document), new StreamResult(
new File("src/xml/book1.xml"))); } }

使用JAXP对xml文档进行DOM解析基础的更多相关文章

  1. 2.1 使用JAXP 对 xml文档进行DOM解析

    //使用 jaxp 对xml文档进行dom解析 public class Demo2 { //必要步骤 @Test public void test() throws Exception { //1. ...

  2. 使用JAXP对XML文档进行DOM解析

    import java.io.FileOutputStream; import javax.xml.parsers.DocumentBuilder; import javax.xml.parsers. ...

  3. javaweb学习总结十一(JAXP对XML文档进行DOM解析)

    一:将内存中写好的xml文件读取到硬盘上 二:DOM方式对xml文件进行增删改查 1:添加节点(默认是在最后的子节点后面添加) @Test // 向元素中添加节点<version>1.0& ...

  4. 2.2 使用 JAXP 对XML文档进行SAX解析

    使用JAXP 对 XML文档进行 SAX解析: public class Demo1 { /** * 使用JAXP对XML文档进行SAX解析 * @throws Exception * @throws ...

  5. javaweb学习总结十二(JAXP对XML文档进行SAX解析)

    一:JAXP使用SAX方式解析XML文件 1:dom解析与sax解析异同点 2:sax解析特点 二:代码案例 1:xml文件 <?xml version="1.0" enco ...

  6. XML文档读取-DOM

    DOM(Document Object Model),“文档对象模型”早期是为了解决不用浏览器间数据兼容问题提出的解决方案,现在已经是W3C组织推荐的处理可扩展标志语言的标准编程接口. W3C DOM ...

  7. Java高级特性 第13节 解析XML文档(1) - DOM和XPath技术

    一.使用DOM解析XML文档 DOM的全称是Document Object Model,也即文档对象模型.在应用程序中,基于DOM的XML分析器将一个XML文档转换成一个对象模型的集合(通常称DOM树 ...

  8. JAVA读取XML,JAVA读取XML文档,JAVA解析XML文档,JAVA与XML,XML文档解析(Document Object Model, DOM)

    使用Document Object Model, DOM解析XML文档 也可参考我的新浪博客:http://blog.sina.com.cn/s/blog_43ac5543010190w3.html ...

  9. java: (正则表达式,XML文档,DOM和DOM4J解析方法)

    常见的XML解析技术: 1.DOM(基于XML树结构,比较耗资源,适用于多次访问XML): 2.SAX(基于事件,消耗资源小,适用于数量较大的XML): 3.JDOM(比DOM更快,JDOM仅使用具体 ...

随机推荐

  1. 爬取豆瓣Top250_Ajax动态页面

    爬取网址: 完整代码: import sys from urllib import request, parse import ssl ssl._create_default_https_contex ...

  2. source insight

    关于source inlight的版本 http://www.camnpr.com/archives/559.html   最新版本 http://www.sourceinsight.com/upda ...

  3. 安装repo

    $ sudo apt-get install curl -y$ curl "http://android.git.linaro.org/gitweb?p=tools/repo.git;a=b ...

  4. 使用docker+tomcat部署jenkins

  5. THUSC2019游记

    Day 0 完全没有明明是最后一次机会的紧张感.大概是滚粗的预兆. 住在西郊.房间好小. 和thupc前一样又有一场cometoj,好像又有小裙子了.upd:改成星空棒棒糖! Day 1 早餐有点棒. ...

  6. python基础学习笔记——运算符

    计算机可以进行的运算有很多种,可不只加减乘除这么简单,运算按种类可分为算数运算.比较运算.逻辑运算.赋值运算.成员运算.身份运算.位运算,今天我们暂只学习算数运算.比较运算.逻辑运算.赋值运算 算数运 ...

  7. 在. net平台下,推送IOS,Android,Windows Phone消息

    1,新建项目,在项目中添加引用,dll文件已经上传在百度网盘,点击下载 2,引入命名空间 using PushSharp; using PushSharp.Android; using PushSha ...

  8. python算法-汉诺塔问题

    汉诺塔问题   初始状态: 思考:当盘子的个数是3的时候,大家写出移动顺序 移动的步骤: 3个盘子,从a到c 1.前面两个盘子,从a到b 1)把前面一个盘子,从a到c a->c 2)把第二个盘子 ...

  9. Selenium WebDriver-通过键盘事件操作浏览器

    #encoding=utf-8 import unittest import time import chardet from selenium import webdriver class Visi ...

  10. C++ 将string转换成char*字符串

    我们经常会使用C和C++的混合编程,在某些情况下,需要将C++的string,转换成char* 的字符串.下面说两种可行的方法,作为总结. 1. data(); 如: string str=" ...