DOM4J介绍与代码示例【转载】

DOM4J是dom4j.org出品的一个开源XML解析包。Dom4j是一个易用的、开源的库，用于XML，XPath和XSLT。它应用于Java平台，采用了Java集合框架并完全支持DOM，SAX和JAXP。

DOM4J下载jar包：http://downloads.sourceforge.net/dom4j/dom4j-1.6.1.jar

JAXEN（对XPath的支持）：http://dist.codehaus.org/jaxen/distributions/jaxen-1.1.1.zip

1.DOM4J主要接口

DOM4J主要接口都在org.dom4j这个包里定义。

-Node为所有的dom4j中XML节点定义了多态行为；

-Branch为能够包含子节点的节点如XML元素(Element)和文档(Docuemnts)定义了一个公共的行为；

|-Element 定义XML 元素；

|-Document定义了XML文档；

-DocumentType 定义XML DOCTYPE声明；

-Entity定义 XML entity；

-Attribute定义了XML的属性；

-ProcessingInstruction 定义 XML 处理指令；

-CharacterData是一个标识借口，标识基于字符的节点。如CDATA，Comment, Text；

|- CDATA 定义了XML CDATA 区域；

|-Text 定义XML 文本节点；

|- Comment 定义了XML注释的行为；

2.创建XML文档

示例xml：students.xml

<?xml version="1.0" encoding="UTF-8"?>

<?xml-stylesheet type="text/xsl" href="students.xsl"?>

<students>

    <!--A Student Catalog -->

    <student sn="01">

        <name>sam</name>

        <age>18</age>

    </student>

    <student sn="02">

        <name>lin</name>

        <age>20</age>

    </student>

</students>

下面是用dom4j创建上述文档，通过两种方式创建，一种是调用dom4j提供的方法，一种是通过字符串转换。

import java.io.File;

import java.io.FileWriter;

import java.io.IOException;

import java.util.HashMap;

import java.util.Map;

import org.dom4j.Document;

import org.dom4j.DocumentException;

import org.dom4j.DocumentHelper;

import org.dom4j.Element;

import org.dom4j.io.XMLWriter;

public class XmlGen {

    public Document generateDocumentByMethod() {

        Document document = DocumentHelper.createDocument();

        // ProcessingInstruction

        Map<String, String> inMap = new HashMap<String, String>();

        inMap.put("type", "text/xsl");

        inMap.put("href", "students.xsl");

        document.addProcessingInstruction("xml-stylesheet", inMap);

        // root element

        Element studentsElement = document.addElement("students");

        studentsElement.addComment("An Student Catalog");

        // son element

        Element stuElement = studentsElement.addElement("student");

        stuElement.addAttribute("sn", "01");

        Element nameElement = stuElement.addElement("name");

        nameElement.setText("sam");

        Element ageElement = stuElement.addElement("age");

        ageElement.setText("18");

        // son element

        Element anotherStuElement = studentsElement.addElement("student");

        anotherStuElement.addAttribute("sn", "02");

        Element anotherNameElement = anotherStuElement.addElement("name");

        anotherNameElement.setText("lin");

        Element anotherAgeElement = anotherStuElement.addElement("age");

        anotherAgeElement.setText("20");

        return document;

    }

    public Document generateDocumentByString() {

        String text = "<?xml version=\"1.0\" encoding=\"UTF-8\"?>"

                + "<?xml-stylesheet type=\"text/xsl\" href=\"students.xsl\"?>"

                + "<students><!--An Student Catalog--> <student sn=\"01\">"

                + "<name>sam</name><age>18</age></student><student sn=\"02\">"

                + "<name>lin</name><age>20</age></student></students>";

        Document document = null;

        try {

            document = DocumentHelper.parseText(text);

        } catch (DocumentException e) {

            e.printStackTrace();

        }

        return document;

    }

    public void saveDocument(Document document, File outputXml) {

        try {

            // 美化格式

            OutputFormat format = OutputFormat.createPrettyPrint();

            /*

             * // 缩减格式

             *

             * OutputFormat format = OutputFormat.createCompactFormat();

             */

            /*

             * // 指定XML编码

             *

             * format.setEncoding("GBK");

             */

            XMLWriter output = new XMLWriter(new FileWriter(outputXml), format);

            output.write(document);

            output.close();

        } catch (IOException e) {

            System.out.println(e.getMessage());

        }

    }

    public static void main(String[] argv) {

        XmlGen dom4j = new XmlGen();

        Document document = null;

        // document=dom4j.generateDocumentByMethod();

        document = dom4j.generateDocumentByString();

        dom4j.saveDocument(document, new File("output.xml"));

    }

}

XmlGen.java

方法generateDocumentByMethod()通过调用方法构建xml文档：

1.使用DocumentHelper得到Document实例

Document document = DocumentHelper.createDocument();

2.创建Processing Instruction

document.addProcessingInstruction("xml-stylesheet", inMap);

3.创建元素Element

Element studentsElement = document.addElement("students");

4.为元素添加注释Comment

studentsElement.addComment("An Student Catalog");

5.为元素添加属性

studentsElement.addComment("An Student Catalog");

6.为元素添加文本值Text

ageElement.setText("18");

方法generateDocumentByString()通过字符串转换直接构建xml文档，使用DocumentHelper.parseText()来实现.

document = DocumentHelper.parseText(text);

方法saveDocument(Document document, File outputXml)将文档输出到文件保存，可指定字符编码，可指定格式化输出。

3.修改XML文档

这里使用xpath来定位待修改的元素和属性，需要jaxen的支持。

示例中将students-gen.xml的第一个student元素的sn属性改为001，其子元素name内容改为jeff。

XmlMod.java

import java.io.File;

import java.io.FileWriter;

import java.io.IOException;

import java.util.Iterator;

import java.util.List;

import org.dom4j.Attribute;

import org.dom4j.Document;

import org.dom4j.DocumentException;

import org.dom4j.Element;

import org.dom4j.io.SAXReader;

import org.dom4j.io.XMLWriter;

public class XmlMod {

    public void modifyDocument(File inputXml) {

        try {

            SAXReader saxReader = new SAXReader();

            Document document = saxReader.read(inputXml);

            List list = document.selectNodes("//students/student/@sn");

            Iterator iter = list.iterator();

            while (iter.hasNext()) {

                Attribute attribute = (Attribute) iter.next();

                if (attribute.getValue().equals("01"))

                    attribute.setValue("001");

            }

            list = document.selectNodes("//students/student");

            iter = list.iterator();

            while (iter.hasNext()) {

                Element element = (Element) iter.next();

                Iterator iterator = element.elementIterator("name");

                while (iterator.hasNext()) {

                    Element nameElement = (Element) iterator.next();

                    if (nameElement.getText().equals("sam"))

                        nameElement.setText("jeff");

                }

            }

            XMLWriter output = new XMLWriter(new FileWriter(new File(

                    "students-modified.xml")));

            output.write(document);

            output.close();

        } catch (DocumentException e) {

            System.out.println(e.getMessage());

        } catch (IOException e) {

            System.out.println(e.getMessage());

        }

    }

    public static void main(String[] argv) {

        XmlMod dom4jParser = new XmlMod();

        dom4jParser.modifyDocument(new File("students-gen.xml"));

    }

}

1.使用File定位文件资源，并基于此获得Document实例

SAXReader saxReader = new SAXReader();

Document document = saxReader.read(inputXml);

2.Document实例的selectNodes方法可以传入xpath，并返回一个List实例，基于此使用迭代器，完成特定的应用

List list = document.selectNodes("//students/student/@sn");

4.遍历XML文档

这里提供两种遍历方法，一种是基于迭代的遍历，一种是基于Visitor模式的遍历。

XmlTra.java

import java.io.File;

import java.util.Iterator;

import org.dom4j.Attribute;

import org.dom4j.Document;

import org.dom4j.DocumentException;

import org.dom4j.Element;

import org.dom4j.ProcessingInstruction;

import org.dom4j.VisitorSupport;

import org.dom4j.io.SAXReader;

public class XmlTra {

    private File inputXml;

    public XmlTra(File inputXml) {

        this.inputXml = inputXml;

    }

    public Document getDocument() {

        SAXReader saxReader = new SAXReader();

        Document document = null;

        try {

            document = saxReader.read(inputXml);

        } catch (DocumentException e) {

            e.printStackTrace();

        }

        return document;

    }

    public Element getRootElement() {

        return getDocument().getRootElement();

    }

    public void traversalDocumentByIterator() {

        Element root = getRootElement();

        // 枚举根节点下所有子节点

        for (Iterator ie = root.elementIterator(); ie.hasNext();) {

            System.out.println("======");

            Element element = (Element) ie.next();

            System.out.println(element.getName());

            // 枚举属性

            for (Iterator ia = element.attributeIterator(); ia.hasNext();) {

                Attribute attribute = (Attribute) ia.next();

                System.out.println(attribute.getName() + ":"

                + attribute.getData());

            }

            // 枚举当前节点下所有子节点

            for (Iterator ieson = element.elementIterator(); ieson.hasNext();) {

                Element elementSon = (Element) ieson.next();

                System.out.println(elementSon.getName() + ":"

                + elementSon.getText());

            }

        }

    }

    public void traversalDocumentByVisitor() {

        getDocument().accept(new MyVisitor());

    }

    /**

     *

     * 定义自己的访问者类

     */

    private static class MyVisitor extends VisitorSupport {

        /**

         *

         * 对于属性节点，打印属性的名字和值

         */

        public void visit(Attribute node) {

            System.out.println("attribute : " + node.getName() + " = "

            + node.getValue());

        }

        /**

         *

         * 对于处理指令节点，打印处理指令目标和数据

         */

        public void visit(ProcessingInstruction node) {

            System.out.println("PI : " + node.getTarget() + " "

            + node.getText());

        }

        /**

         *

         * 对于元素节点，判断是否只包含文本内容，如是，则打印标记的名字和 元素的内容。如果不是，则只打印标记的名字

         */

        public void visit(Element node) {

            if (node.isTextOnly())

                System.out.println("element : " + node.getName() + " = "

                + node.getText());

            else

                System.out.println("--------" + node.getName() + "--------");

        }

    }

    public static void main(String[] argv) {

        XmlTra dom4jParser = new XmlTra(new File("students-gen.xml"));

        // dom4jParser.traversalDocumentByIterator();

        dom4jParser.traversalDocumentByVisitor();

    }

}

方法traversalDocumentByIterator()提供一种基于迭代的遍历实现，每个Element通过elementIterator()和attributeIterator()取代其子元素和属性的迭代器。

Visitor是GOF设计模式之一。其主要原理就是两种类互相保有对方的引用，并且一种作为Visitor去访问许多Visitable。DOM4J中的Visitor模式只需要自定一个类实现Visitor接口即可。

public class MyVisitor extends VisitorSupport {

    public void visit(Element element) {

        System.out.println(element.getName());

    }

    public void visit(Attribute attr) {

        System.out.println(attr.getName());

    }

}

调用： root.accept(new MyVisitor())

Visitor接口提供多种Visit()的重载，根据XML不同的对象，将采用不同的方式来访问。上面是给出的Element和Attribute的简单实现，一般比较常用的就是这两个。VisitorSupport是DOM4J提供的默认适配器，Visitor接口的Default Adapter模式，这个模式给出了各种visit(*)的空实现，以便简化代码。

注意，这个Visitor是自动遍历所有子节点的。如果是root.accept(MyVisitor)，将遍历子节点。我第一次用的时候，认为是需要自己遍历，便在递归中调用Visitor，结果可想而知。

5.使用ElementHandler

XmlHandler.java

import java.io.File;

import org.dom4j.DocumentException;

import org.dom4j.Element;

import org.dom4j.ElementHandler;

import org.dom4j.ElementPath;

import org.dom4j.io.SAXReader;

public class XmlHandler {

    public static void main(String[] args) {

       SAXReader saxReader = new SAXReader();

       File file = new File("students.xml");

       try {

           // 添加一个ElementHandler实例。

           saxReader.addHandler("/students/student", new StudentHandler());

           saxReader.read(file);

       } catch (DocumentException e) {

           System.out.println(e.getMessage());

       }

    }

    /**

     * 定义StudentHandler处理器类，对<student>元素进行处理。

     */

    private static class StudentHandler implements ElementHandler {

       public void .Start(ElementPath path) {

           Element elt = path.getCurrent();

           System.out.println("Found student: " + elt.attribut.ue("sn"));

           // 添加对子元素<name>的处理器。

           path.addHandler("name", new NameHandler());

       }

       public void .End(ElementPath path) {

           // 移除对子元素<name>的处理器。

           path.removeHandler("name");

       }

    }

    /**

     * 定义NameHandler处理器类，对<student>的<name>子元素进行处理。

     */

    private static class NameHandler implements ElementHandler {

       public void .Start(ElementPath path) {

           System.out.println("path : " + path.getPath());

       }

       public void .End(ElementPath path) {

           Element elt = path.getCurrent();

           // 输出<name>元素的名字和它的文本内容。

           System.out.println(elt.getName() + " : " + elt.getText());

       }

    }

}

6.使用XSLT转换XML

这里必须使用JAXP的支持。

import javax.xml.transform.Transformer;

import javax.xml.transform.TransformerFactory;

import org.dom4j.Document;

import org.dom4j.io.DocumentResult;

import org.dom4j.io.DocumentSource;

    ……

    public Document styleDocument(Document document, String stylesheet)

           throws Exception {

       // load the transformer using JAXP

       TransformerFactory factory = TransformerFactory.newInstance();

       Transformer transformer = factory.newTransformer(new StreamSource(stylesheet));

       // now lets style the given document

       DocumentSource source = new DocumentSource(document);

       DocumentResult result = new DocumentResult();

       transformer.transform(source, result);

       // return the transformed document

       Document transformedDoc = result.getDocument();

       return transformedDoc;

    }

……

本文出自 “子孑” 博客，请务必保留此出处http://zhangjunhd.blog.51cto.com/113473/126310

DOM4J介绍与代码示例【转载】的更多相关文章

DOM4J介绍与代码示例
DOM4J是dom4j.org出品的一个开源XML解析包.Dom4j是一个易用的.开源的库,用于XML,XPath和XSLT.它应用于Java平台,采用了Java集合框架并完全支持DOM,SAX和JA ...
DOM4J介绍与代码示例(2)-XPath 详解
XPath 详解,总结 XPath简介 XPath是W3C的一个标准.它最主要的目的是为了在XML1.0或XML1.1文档节点树中定位节点所设计.目前有XPath1.0和 XPath2.0两个版本.其 ...
设计模式：装饰者模式介绍及代码示例 && JDK里关于装饰者模式的应用
0.背景来看一个项目需求:咖啡订购项目. 咖啡种类有很多:美式.摩卡.意大利浓咖啡: 咖啡加料:牛奶.豆浆.可可. 要求是,扩展新的咖啡种类的时候,能够方便维护,不同种类的咖啡需要快速计算多少钱,客 ...
PHP数组函数实现栈与队列的方法介绍（代码示例）
根据php提供的四个关于数组的函数: array_push(),array_pop(),array_unshift(),array_shift() 配合数组本身,一下子就实现了栈(stack)和队例( ...
【嵌入式开发】裸机引导操作系统和ARM 内存操作 ( DRAM SRAM 类型简介 | Logical Bank | 内存地址空间介绍 | 内存芯片连接方式 | 内存初始化 | 汇编代码示例 )
[嵌入式开发]ARM 内存操作 ( DRAM SRAM 类型简介 | Logical Bank | 内存地址空间介绍 | 内存芯片连接方式 | 内存初始化 | 汇编代码示例 ) 一. 内存 ...
Python实现各种排序算法的代码示例总结
Python实现各种排序算法的代码示例总结作者:Donald Knuth 字体:[增加减小] 类型:转载时间:2015-12-11我要评论这篇文章主要介绍了Python实现各种排序算法的代码示 ...
使用XStream注解实现Java对象与XML互相转换的代码示例
本文记录一下使用xstream这个api的注解特性对Java对象与XML字符串相互转换的一些代码示例. 我们很多人都处理过XML文件,也有很多非常成熟的第三方开源软件.如:jdom.dom4j等 ...
JAVA NIO工作原理及代码示例
简介:本文主要介绍了JAVA NIO中的Buffer, Channel, Selector的工作原理以及使用它们的若干注意事项,最后是利用它们实现服务器和客户端通信的代码实例. 欢迎探讨,如有错误敬请 ...
Java XML解析工具 dom4j介绍及使用实例
Java XML解析工具 dom4j介绍及使用实例 dom4j介绍 dom4j的项目地址:http://sourceforge.net/projects/dom4j/?source=directory ...

随机推荐

C#语言的Image和byte数组的互相转换
/// <summary> /// 字节数组转换为图片 /// </summary> /// <param name="buffer">字节数组 ...
NoSQL专家王涛访谈：为什么我们还要做一个NoSQL？
ChinaUnix:各位网友大家好,今天有幸请到王涛先生到CU做客,与大家交流一些工作经验.首先请王涛先介绍一下自己. 王涛:大家好,我是王涛.过去八年里我一直在IBM多伦多实验室从事DB2引擎研发的 ...
解析php file_exists无效的解决办法
php中file_exists无效的解决办法. 方法1 :据官方手册上描述若php教程的safe mode相关的设置过于苛刻,就会出现这样的情形:尽管文件真实存在也被误报,认为文件不存在. 由于服务器 ...
Spark小课堂Week6 启动日志详解
Spark小课堂Week6 启动日志详解作为分布式系统,Spark程序是非常难以使用传统方法来进行调试的,所以我们主要的武器是日志,今天会对启动日志进行一下详解. 日志详解今天主要遍历下Strea ...
python 实现文件批量拷贝
场景:某个文件夹下面包含数量巨大的文件,需求需要将这些文件按组(比如5000个一组)存放到不同的目录中去. # Filename: CopyFiles.py import os import os.p ...
字符串做异或使用union
#include <stdio.h> #include <sys/time.h> #include <string.h> union data { unsigned ...
2016022601 - redis入门了解
今天开始学习redis,先从网页上学习,主要学习地址是:易百中的redis和redis中国网站. 此片章学习来自于自:http://www.yiibai.com/redis/redis_quick_g ...
proguardgui.bat来混淆已有的jar包
1.U:\android-sdk\tools\proguard\bin\找到 proguardgui.bat,双击就可以弹出一个混淆的界面 2.加入不要混淆的,比如我们用的系统的,还有别人的jar 3 ...
Linux下Mysql数据库备份
今天一同事的电脑无缘无故坏了,找了IT部门检测说是硬盘坏了,数据无法恢复.好悲剧.自己博客也写了好久不容易,要是突然间数据丢了那怎么办!于是写了个数据库自动备份脚本,并创建任务计划,实现每天22:30 ...
十五、mysql 分区之分区管理
1.mysql分区处理分区字段NULL值的方式 1.range分区null被当作最小值处理 2.list分区null值必须被枚举出来,否则将出错 3.hash/key分区 null值当作0处理 2.R ...

DOM4J介绍与代码示例【转载】

DOM4J介绍与代码示例【转载】的更多相关文章

随机推荐

热门专题