XML 解析之 jaxp 解析器

XML 的解析方式有两种方式: DOM 解析和 SAX 解析.
DOM 解析: 根据 XML 的层级结构, 在内存中分配一个树形结构, 把 XML 的标签, 属性和文本都封装成对象.
- 优点: 可以实现增删改查操作
- 弊端: 如果文件过大, 容易造成内存溢出
SAX 解析: 采用事件驱动, 边读边解析. 从上到下, 一行一行的解析, 解析到某一个对象, 把对象返回.
- 优点: 可以方便的实现查询
- 不能实现增删改操作
XML 解析器
- jaxp 解析器, 由 SUN 公司提供的针对 dom 和 sax 的解析器
- dom4j 解析器, 由 dom4j 组织提供的针对 dom 和 sax 的解析器

jaxp 解析器

jaxp 解析器在 JDK 的 javax.xml.parsers 包里面
DOM 解析使用到的类:
- DocumentBuilder : 解析器类
- DocumentBuildreFactory : 解析器工厂类
SAX 解析使用到的类:
- SAXParser : 解析器类
- SAXParserFactory : 解析器工厂

jaxp 解析器的 DOM 方式解析 xml 文件

DocumentBuilder 解析器类
- 该解析器类是一个抽象类, 不能 new. 此类的实例可以从 DocumentBuilderFactory.newDocumentBuilder() 方法获取.
- 解析 xml 文档, 使用解析器类中的 parse("xml 路径");方法, 返回的是 Document 对象, 其父接口为 Node
- Document 对象中的方法:
  - getElementsByTagName(String tagname); : 获取标签, 返回的是 NodeList 集合
  - createElement(String tagName); : 创建标签
  - createTextNode(String data); : 创建文本
  - appendChild(Node newChild); : 将文本添加到标签下面
DocumentBuilderFactory 解析器工厂
- 该解析器工厂也是一个抽象类, 不能直接 new. 以 DocumentBuilderFactory.newInstance() 获取对应的实例.
使用 jaxp 解析器实现对 xml 文档的增删改查

// 示例:

// xml 文件

<?xml version="1.0" encoding="gbk"?>

<person>

    <p1>

        <name>zhangsan</name>

        <age>20</age>

    </p1>

    <p1>

        <name>lisi</name>

        <age>32</age>

    </p1>

</person>

// 查询: 查询 xml 文件中所有的 name 元素的值

    /*

     * 思路:

     *    1. 创建解析器工厂

     *    2. 根据解析器工厂创建解析器

     *    3. 解析 xml 返回 document, 需要导包, org.w3c.dom.Document

     *    4. 使用 document 对象中的 getElementsByTagName() 方法, 获取 NodeList 集合

     *    5. 遍历集合, 获取每一个 name 对应的值

     */

    public class TestJaxp {

        public static void main(String[] args){

            // 1. 创建解析器工厂

            DocumentBuilderFactory builderFactory = DocumentBuilderFactory.newInstance();

            // 2. 根据解析器工厂创建解析器

            DocumentBuilder builder = builderFactory.newDocumentBuilder();

            // 3. 解析 xml 文档

            Document document = builder.parser("src/person.xml");

            // 4. 得到 name 元素

            NodeList list = document.getElementsByTagName("name");

            // 5. 遍历集合, 得到每一个 name 元素, NodeList 接口位于 org.w3c.dom 包下

            for(int i=0; i<list.getLength(); i++){

                Node name1 = list.item(i);

                // 得到 name 元素里面的值

                String s = name1.getTextContent();

                System.out.println("name:"+s);

            }

        }

    }

// 添加: 在第一个 p1 下面添加 <sex>male</sex>

    /*

     * 思路:

     *    1. 创建解析器工厂

     *    2. 根据解析器工厂创建解析器

     *    3. 解析 xml 文档返回 document

     *    4. 获取第一个 p1 元素

     *    5. 创建 sex 标签, createElement

     *    6. 创建文本 "male", createTextNode

     *    7. 把文本添加到 sex 下面, appendChild()

     *    8. 把 sex 添加到第一个 p1 下面

     *

     *

     *    9. 回写 xml 文档(将内存中的数据写入到硬盘中)

     *        9.1 创建 TransformerFactory 工厂

     *        9.2 创建 Transformer 类

     *        9.3 回写

     */

     public class TestJaxp{

        public static void main(String[] args){

            // 1. 创建解析器工厂

            DocumentBuilderFactory builderFactory = DocumentBuilderFactory.newInstance();

            // 2. 创建解析器

            DocumentBuilder builder = builderFactory.newDocumentBuilder();

            // 3. 解析 xml 文档

            Document document = builder.parse("src/person.xml");

            // 4. 获取所有 p1 元素

            NodeList list = document.getElementsByTagName("p1");

            // 5. 获取第一个 p1 元素

            Node p1 = list.item(0);

            // 6. 创建 sex 标签

            Element sex1 = document.createElement("sex");

            // 7. 创建 "male" 文本

            TextNode text1 = document.createTextNode("male");

            // 8. 将文本添加到 sex 标签下, 没有返回值

            sex1.appendChild(text1);

            // 9. 将 sex 标签添加到 p1 下面

            p1.appendChild(sex1);

            // 10. 回写 xml

            // 创建 TransformerFactory 工厂

            TransformerFactory transformerFactory = TransformerFactory.newInstance();

            // 得到 Transformer 类

            Transformer transformer = transformerFactory.newTransformer();

            // 回写

            //  transform(Source xmlSource, Result outputTarget);

            // Source 是接口, DOMSource 是其中的一个实现类.

            // Result 也是接口, StreamResult 是其中的一个实现类

            transformer.transform(new DOMSource(document), new StreamResult("src/person.xml"));

        }

    }

// 升级版, 把获取 document 对象封装成方法,

// 只要对 xml 文档进行增删改操作, 都需要回写 xml , 因此回写 xml 也封装成一个方法

public class JaxpUtils{

    // 返回 document 对象

    public static Document getDocument(String path){

        // 有异常需要 try/catch

        try{

            // 1. 创建解析器工厂

            DocumentBuilderFactory builderFactory = DocumentBuilderFactory.newInstance();

            // 2. 根据解析器工厂创建解析器

            DocumentBuilder builder = builderFactory.newDocumentBuilder();

            // 3. 解析 xml 文档,获取 document 对象

            Document document = builder.parser(path);

            // 4. 将结果返回

            return document;

        } catch (Exception e){

            e.printStackTrace();

        }

        // 如果出现异常, 返回 null

        return null;

    }

    // 回写 xml 操作

    public static void xmlTransform(Document document, String path){

        try{

            // 1. 创建 TransformerFactory 工厂

            TransformerFactory transformerFactory = TransformerFactor.newInstance();

            // 2. 得到 Transformer 类

            Transformer transformer = transformerFactory.newTransformer();

            // 3. 使用 transform 方法进行回写

            transformer.transform(new DOMSource(document), new StreamResult(path));

        } catch(Exception e){

            e.printStackTrace();

        }

    }

}

// 删除: 删除 p1 下面的 <sex>male</sex>

public void remSex(){

    // 1. 获取 document 对象

    Document document = JaxpUtils.getDocument("src/person.xml");

    // 2. 获取 sex 标签

    NodeList list = document.getElementsByTagName("sex")

    Node sex1 = list.item(0);

    // 3. 使用 sex 的父节点并删除 sex,

    //    获取父节点, 使用 getParentNode 方法

    sex1.getParentNode.removeChild(sex1);

    // 4. 回写 xml

    JaxpUtils.xmlTransform(document,"src/person.xml");

}

// 使用 jaxp 遍历节点, 也就是把 xml 中的所有元素名称打印出来

    /*

     * 思路: 使用递归实现遍历

     *    1. 得到根节点

     *    2. 得到根节点的子节点

     *    3. 得到根节点的子节点的子节点

     */

     public static void listElement(String path) throws Exception{

        // 1. 获取 document 对象

        Document document = JaxpUtils.getDocument("src/person.xml");

        // 2. 编写一个方法实现遍历

        list2(document);

    }

    // 因为 Node 是 Document 的父接口

    // list(Document document) 升级为 list(Node node)

    public static void list2(Node node){

        // 判断是否是元素, 如果是, 就输出

        // 如果不判断, 会把空格和换行当成内容也打印出来

        if(node.getNodeType() == Node.ELEMENT_NODE){

            System.out.println(node.getNodeName);

        }

        // 得到第一层子节点

        NodeList list = node.getChildNodes();

        // 遍历 list

        for(int i=0; i<list.getLength(); i++){

            // 得到每一个节点

            Node node2 = list.item(i);

            // 递归

            list2(node2);

        }

    }

jaxp 解析器的 SAX 方式解析 xml 文件

SAX 方式解析 xml 文档, 只能实现对文档的查询操作,不能实现增删改操作.
SAXParser 解析器
- 该解析器的实例通过 SAXParserFactory.newSAXParser() 方法获得
- 解析 xml 文档, 使用解析器类中的 parse(String uri, DefaultHandler dh);方法, 返回值为 void
- String uri : xml 文档的路径
- DefaultHandler dh: 事件处理器, 相当于在 parse() 方法上绑定了一个事件
SAXParserFactory 解析器工厂
- 通过 newInstance() 方法获得
使用 jaxp 的 SAX 方式解析 xml 文档

// DefaultHandler 说明

    // 1. DefaultHandler 中有三个方法: startElement, characters, endElement

    // 2. 当解析到开始标签时, 自动执行 startElement 方法,

    // 3. 当解析到文本内容时, 自动执行 characters 方法

    // 4. 当解析到标签结束时, 自动执行 endElement 方法

// 示例:

// xml 文件

<?xml version="1.0" encoding="gbk"?>

<person>

    <p1>

        <name>zhangsan</name>

        <age>20</age>

    </p1>

    <p1>

        <name>lisi</name>

        <age>32</age>

    </p1>

</person>

// 需求一: 打印 xml 文档中所有元素

    /*

     * 思路:

     *    1. 创建解析器工厂

     *    2. 创建解析器

     *    3. 执行 parse 方法

     *

     *    4. 自己创建一个类, 继承 DefaultHandler

     *    5. 重写类里面的三个方法

     * /

    public class TestJaxp{

         public static void main(String[] args){

            // 1. 创建解析器工厂

            SAXParserFactory saxParserFactory = SAXParserFactory.newInstance();

            // 2. 创建解析器

            SAXParser saxParser = saxParserFactory.newSAXParser();

            // 3. 执行 parse 方法, 并传入自定义的事件处理器

            saxParser.parse("src/person.xml", new MyDefault2());

        }

    }

    // 打印整个文档的事件处理器

    class MyDefault2 extends DefaultHandler{

        // 重写 startElement

        public void startElement(String uri, String localName, String qname,

                Attributes attributes) throws SAXException{

                System.out.print("<"+qName+"/>");  // qName 表示的是标签名, 此处输出的是开始标签

            }

        // 重写 characters 方法

        public void characters(char[] ch, int start, int length) throws SAXException{

            System.out.print(new String(ch,start,length));  // 打印元素中的文本

        }

        // 重写 endElement 方法

        public void endElement(String uri, String localName, String qName) throws SAXException{

            System.out.print("</"+qName+">");   // qName 表示的是标签名, 此处输出的是结束标签

        }

    }

    // 获取所有的 name 元素的值, 事件处理器

    class MyDefault3 extends DefaultHandler{

        // 定义变量

        boolean flag = false;

        // 重写 startElement

        public void startElement(String uri, String localName, String qname,

                Attributes attributes) throws SAXException{

                // 判断 qName 是否是 name 元素

                if("name".equals(qName)){

                    flag = true;

                }

            }

        // 重写 characters 方法

        public void characters(char[] ch, int start, int length) throws SAXException{

            // 如果 flag 值是 true 的时候, 表示解析到的是 name 元素

            if(flag){

                System.out.println(new String(ch,start,length));

            }

        }

        // 重写 endElement 方法

        public void endElement(String uri, String localName, String qName) throws SAXException{

            // 重置 flag 标记, 表示 name 元素读取结束

            if("name".equals(qName)){

                flag = false;

            }

        }

    }

    // 获取第一个 name 元素中的值

    class MyDefault3 extends DefaultHandler{

        // 定义变量

        boolean flag = false;

        int count=1;

        // 重写 startElement

        public void startElement(String uri, String localName, String qname,

                Attributes attributes) throws SAXException{

                // 判断 qName 是否是 name 元素

                if("name".equals(qName)){

                    flag = true;

                }

            }

        // 重写 characters 方法

        public void characters(char[] ch, int start, int length) throws SAXException{

            // 如果 flag 值是 true 的时候, 表示解析到的是 name 元素

            if(flag && count == 1){

                System.out.println(new String(ch,start,length));

            }

        }

        // 重写 endElement 方法

        public void endElement(String uri, String localName, String qName) throws SAXException{

            // 重置 flag 标记, 表示 name 元素读取结束

            if("name".equals(qName)){

                flag = false;

                count++;

            }

        }

    }

参考资料:

XML 解析之 jaxp 解析器的更多相关文章

dom技术解析xml下jaxp解析器详细代码
1.使用jaxp实现查询操作 person.xml <?xml version="1.0" encoding="UTF-8" standalone=&qu ...
xml解析方式之JAXP解析入门
XML解析 1 引入 xml文件除了给开发者看,更多的情况使用[程序读取xml文件]的内容.这叫做xml解析 2 XML解析方式(原理不同) DOM解析 SAX解析 3 XML解析工具 DOM解析原理 ...
java 之 xml 之解析工具jaxp
一.jaxp的api查看 *jaxp是javase一部分 *jaxp解析器在jdk的javax.xml.parsers包里面 *共四个类:分别针对dom和sax解析使用的类 *dom解析类: Docu ...
XML解析之JAXP
body, table{font-family: 微软雅黑; font-size: 10pt} table{border-collapse: collapse; border: solid gray; ...
xml文件解析（使用解析器）
一.Xml解析,解析xml并封装到list中的javabean中 OM是用与平台和语言无关的方式表示XML文档的官方W3C标准.DOM是以层次结构组织的节点或信息片断的集合.这个层次结构允许开发人员在 ...
XML解析之JAXP案例详解
根据一个CRUD的案例,对JAXP解析xml技术,进行详细的解释: 首先,已知一个xml文件中的数据如下: <?xml version="1.0" encoding=&quo ...
javaweb学习总结十三(dom4j方式对XML文档进行解析以及Xpath的使用)
一:dom4j方式介绍对于xml的解析总共有三种 1:jaxp方式,是sun公司开发的,分为sax方式和dom方式 2:jdom方式,后来其中部分人员参与开发dom4j 3:dom4j方式,是现在企 ...
Android XML文档解析(一)——SAX解析
---------------------------------------------------------------------------------------------------- ...
xml常用四种解析方式优缺点的分析×××××
xml常用四种解析方式优缺点的分析博客分类: xml 最近用得到xml的解析方式,于是就翻了翻自己的笔记同时从网上查找了资料,自己在前人的基础上总结了下,贴出来大家分享下. 首先介绍一下xml语 ...

随机推荐

DDR3调试总结
DDR3调试总结本文为原创,转载请注明作者与出处 http://blog.csdn.net/hanfei_1/article/details/70546010 以前同是DDR3的无知少年,由于项目需 ...
[k8s]k8s-web-terminal配置使用 & etcdui etcd browser配置 & etcdkeeper3配置
安装kube-dns后,我想看看他是怎么个配置,于是我就找到了这个参考: https://github.com/beyondblog/k8s-web-terminal cat >> /e ...
转：SNMP 原理及配置简述
SNMP 原理及配置简述转载 2016年01月13日 16:18:51 随着机器数量的增长,管理员不能像过去那样,一台台机器进行监控.解决问题,而需要借助各方工具进行统一监控和管理.利用SNMP,一 ...
用Doxygen+Graphviz生成函数调用流程图(转)
源文链接: http://wildpointer.net/2012/04/14/doxygen_graphviz/ 上面这张图是用Doxygen+Graphviz从netcat的源代码生成的函数调用关 ...
李洪强和你一起学习前端之(3)Css基础和选择器
大家好! 经过了前面的学习,是不是对前端的学习有了初步的了解.虽然我之前有iOS开发的经验,现在接触一门新的语言,对我来说有一定的优势,但是一门技术对于谁来说都是公平的,我承认,我在接触新知识的时候 ...
Ehcache2 的配置(不使用配置文件)
EhCache是一个开放源码的,基于标准的高速缓存系统. 网上关于EhCache的使用配置很多,但是一般是基于配置文件的.但是实际应用中.我们可能需要动态的管理缓存,这时候单纯配置文件就不够用了. 所 ...
解决VMware10虚拟机客户机操作系统无苹果MacOSX
安装完VMwareWorkstation10.0.3虚拟机,满心希望安装苹果系统MAC OS X 10.9 Mavericks玩一把,却发现VMware10虚拟机客户机操作系统选项里并没有苹果Mac ...
在一个千万级的数据库查寻中，如何提高查询效率？分别说出在数据库设计、SQL语句、java等层面的解决方案。
在一个千万级的数据库查寻中,如何提高查询效率?分别说出在数据库设计.SQL语句.java等层面的解决方案. 解答: 1)数据库设计方面: a. 对查询进行优化,应尽量避免全表扫描,首先应考虑在 whe ...
EJB EJB定义了一组可重用的组件：Enterprise Beans
EJB EJB定义了一组可重用的组件:Enterprise Beans.开发人员可以利用这些组件,像搭积木一样建立分布式应用.
<!>字体效果
<h1>...</h1>标题字(最大) <h6>...</h6>标题字(最小) <b>...</b>粗体字 <strong ...

XML 解析之 jaxp 解析器

jaxp 解析器

jaxp 解析器的 DOM 方式解析 xml 文件

jaxp 解析器的 SAX 方式解析 xml 文件

XML 解析之 jaxp 解析器的更多相关文章

随机推荐

热门专题