JAVA 使用Dom4j 解析XML
[转自] http://blog.csdn.net/yyywyr/article/details/38359049
解析XML的方式有很多,本文介绍使用dom4j解析xml。
1、环境准备
(1)下载dom4j-1.6.1.jar
(2)下载junit-4.10.jar
2、温馨提示
解析XML过程是通过获取Document对象,然后继续获取各个节点以及属性等操作,因此获取Document对象是第一步,大体说来,有三种方式:
(1)自己创建Document对象
- Document document = DocumentHelper.createDocument();
- Element root = document.addElement("students");
其中students是根节点,可以继续添加其他节点等操作。
(2)读取XML文件获取Document对象
- //创建SAXReader对象
- SAXReader reader = new SAXReader();
- //读取文件 转换成Document
- Document document = reader.read(new File("XXXX.xml"));
(3)读取XML文本内容获取Document对象
- String xmlStr = "<students>......</students>";
- Document document = DocumentHelper.parseText(xmlStr);
3、示例
(1)xml文件内容如下
- <?xml version="1.0" encoding="UTF-8"?>
- <students>
- <student1 id="001">
- <微信公众号>@残缺的孤独</微信公众号>
- <学号>20140101</学号>
- <地址>北京海淀区</地址>
- <座右铭>要么强大,要么听话</座右铭>
- </student1>
- <student2 id="002">
- <新浪微博>@残缺的孤独</新浪微博>
- <学号>20140102</学号>
- <地址>北京朝阳区</地址>
- <座右铭>在哭泣中学会坚强</座右铭>
- </student2>
- </students>
(2)解析过程
- package cn.com.yy.dom4j;
- import java.io.File;
- import java.util.Iterator;
- import java.util.List;
- import org.dom4j.Attribute;
- import org.dom4j.Document;
- import org.dom4j.Element;
- import org.dom4j.io.SAXReader;
- import org.junit.Test;
- public class Dom4JforXML {
- @Test
- public void test() throws Exception{
- //创建SAXReader对象
- SAXReader reader = new SAXReader();
- //读取文件 转换成Document
- Document document = reader.read(new File("src/cn/com/yy/dom4j/s.xml"));
- //获取根节点元素对象
- Element root = document.getRootElement();
- //遍历
- listNodes(root);
- }
- //遍历当前节点下的所有节点
- public void listNodes(Element node){
- System.out.println("当前节点的名称:" + node.getName());
- //首先获取当前节点的所有属性节点
- List<Attribute> list = node.attributes();
- //遍历属性节点
- for(Attribute attribute : list){
- System.out.println("属性"+attribute.getName() +":" + attribute.getValue());
- }
- //如果当前节点内容不为空,则输出
- if(!(node.getTextTrim().equals(""))){
- System.out.println( node.getName() + ":" + node.getText());
- }
- //同时迭代当前节点下面的所有子节点
- //使用递归
- Iterator<Element> iterator = node.elementIterator();
- while(iterator.hasNext()){
- Element e = iterator.next();
- listNodes(e);
- }
- }
- }
(3)解析结果
- 当前节点的名称:students
- 当前节点的名称:student1
- 属性id:001
- 当前节点的名称:微信公众号
- 微信公众号:@残缺的孤独
- 当前节点的名称:学号
- 学号:20140101
- 当前节点的名称:地址
- 地址:北京海淀区
- 当前节点的名称:座右铭
- 座右铭:要么强大,要么听话
- 当前节点的名称:student2
- 属性id:002
- 当前节点的名称:新浪微博
- 新浪微博:@残缺的孤独
- 当前节点的名称:学号
- 学号:20140102
- 当前节点的名称:地址
- 地址:北京朝阳区
- 当前节点的名称:座右铭
- 座右铭:在哭泣中学会坚强
4、dom4j操作节点属性
使用dom4j可以操作节点属性,比如添加节点属性、删除节点属性、修改属性值等操作。下面使用dom4j为上述的student1节点删除id属性,新添name属性。
(1)代码示例
- @Test
- public void test2()throws Exception{
- //创建SAXReader对象
- SAXReader reader = new SAXReader();
- //读取文件 转换成Document
- Document document = reader.read(new File("src/cn/com/yy/dom4j/s.xml"));
- //获取根节点元素对象
- Element root = document.getRootElement();
- System.out.println("-------添加属性前------");
- //获取节点student1
- Element student1Element = root.element("student1");
- //遍历
- listNodes(student1Element);
- //获取其属性
- Attribute idAttribute = student1Element.attribute("id");
- //删除其属性
- student1Element.remove(idAttribute);
- //为其添加新属性
- student1Element.addAttribute("name", "这是student1节点的新属性");
- System.out.println("-------添加属性后------");
- listNodes(student1Element);
- }
(2)结果
- -------添加属性前------
- 当前节点的名称:student1
- <span style="background-color: rgb(255, 0, 0);">属性id:001</span>
- 当前节点的名称:微信公众号
- 微信公众号:@残缺的孤独
- 当前节点的名称:学号
- 学号:20140101
- 当前节点的名称:地址
- 地址:北京海淀区
- 当前节点的名称:座右铭
- 座右铭:要么强大,要么听话
- -------添加属性后------
- 当前节点的名称:student1
- <span style="background-color: rgb(255, 255, 255);"><span style="color:#ff0000;">属性name:这是student1节点的新属性
- </span></span>当前节点的名称:微信公众号
- 微信公众号:@残缺的孤独
- 当前节点的名称:学号
- 学号:20140101
- 当前节点的名称:地址
- 地址:北京海淀区
- 当前节点的名称:座右铭
- 座右铭:要么强大,要么听话
5、dom4j新增节点
使用dom4j可以删除指定节点、新增节点等操作,我们使用dom4j为student1节点新增phone节点,如下。
(1)代码
- //添加节点
- @Test
- public void test3()throws Exception{
- //创建SAXReader对象
- SAXReader reader = new SAXReader();
- //读取文件 转换成Document
- Document document = reader.read(new File("src/cn/com/yy/dom4j/s.xml"));
- //获取根节点元素对象
- Element root = document.getRootElement();
- System.out.println("-------添加节点前------");
- //获取节点student1
- Element student1Element = root.element("student1");
- //遍历
- listNodes(student1Element);
- //添加phone节点
- Element phoneElement = student1Element.addElement("phone");
- //为phone节点设置值
- phoneElement.setText("137xxxxxxxx");
- System.out.println("-------添加节点后------");
- listNodes(student1Element);
- }
(2)结果
- -------添加节点前------
- 当前节点的名称:student1
- 属性id:001
- 当前节点的名称:微信公众号
- 微信公众号:@残缺的孤独
- 当前节点的名称:学号
- 学号:20140101
- 当前节点的名称:地址
- 地址:北京海淀区
- 当前节点的名称:座右铭
- 座右铭:要么强大,要么听话
- -------添加节点后------
- 当前节点的名称:student1
- 属性id:001
- 当前节点的名称:微信公众号
- 微信公众号:@残缺的孤独
- 当前节点的名称:学号
- 学号:20140101
- 当前节点的名称:地址
- 地址:北京海淀区
- 当前节点的名称:座右铭
- 座右铭:要么强大,要么听话
- 当前节点的名称:phone
- <span style="color:#ff0000;">phone:137xxxxxxxx</span>
6、把Document对象写入新的文件
有时,我们需要把document对象写入新的文件,dom4j提供了对应的API以便我们进行操作。我们在完成第 5 后,把document写入新的文件s1.xml,如下。
(1)代码
- //添加节点后,写入新的文件
- @Test
- public void test4()throws Exception{
- //创建SAXReader对象
- SAXReader reader = new SAXReader();
- //读取文件 转换成Document
- Document document = reader.read(new File("src/cn/com/yy/dom4j/s.xml"));
- //获取根节点元素对象
- Element root = document.getRootElement();
- System.out.println("-------添加节点前------");
- //获取节点student1
- Element student1Element = root.element("student1");
- //遍历
- listNodes(student1Element);
- //添加phone节点
- Element phoneElement = student1Element.addElement("phone");
- //为phone节点设置值
- phoneElement.setText("137xxxxxxxx");
- System.out.println("-------添加节点后------");
- listNodes(student1Element);
- //把student1Element写入新文件
- writerDocumentToNewFile(document);
- System.out.println("---写入完毕----");
- }
- //document写入新的文件
- public void writerDocumentToNewFile(Document document)throws Exception{
- //输出格式
- OutputFormat format = OutputFormat.createPrettyPrint();
- //设置编码
- format.setEncoding("UTF-8");
- //XMLWriter 指定输出文件以及格式
- XMLWriter writer = new XMLWriter(new OutputStreamWriter(new FileOutputStream(new File("src/cn/com/yy/dom4j/s1.xml")),"UTF-8"), format);
- //写入新文件
- writer.write(document);
- writer.flush();
- writer.close();
- }
(2)查看s1.xml文件
- <?xml version="1.0" encoding="UTF-8"?>
- <students>
- <student1 id="001">
- <微信公众号>@残缺的孤独</微信公众号>
- <学号>20140101</学号>
- <地址>北京海淀区</地址>
- <座右铭>要么强大,要么听话</座右铭>
- <phone>137xxxxxxxx</phone>
- </student1>
- <student2 id="002">
- <新浪微博>@残缺的孤独</新浪微博>
- <学号>20140102</学号>
- <地址>北京朝阳区</地址>
- <座右铭>在哭泣中学会坚强</座右铭>
- </student2>
- </students>
因为涉及到中文,所以在输出时要设定UTF8编码,OutputStreamWriter进行设置编码。
还有输出格式的问题,在此处使用的是OutputFormat.createPrettyPrint(),输出文档时进行了排版格式化。还有一种是OutputFormat.createCompactFormat()方法,输出内容是一行,没有进行格式化,是紧凑型的输出。如下:
- <?xml version="1.0" encoding="UTF-8"?>
- <students><student1 id="001"><微信公众号>@残缺的孤独</微信公众号><学号>20140101</学号><地址>北京海淀区</地址><座右铭>要么强大,要么听话</座右铭><phone>137xxxxxxxx</phone></student1><student2 id="002"><新浪微博>@残缺的孤独</新浪微博><学号>20140102</学号><地址>北京朝阳区</地址><座右铭>在哭泣中学会坚强</座右铭></student2></students>
最后,为大家附上源代码。java dom4j解析xml
JAVA 使用Dom4j 解析XML的更多相关文章
- java使用dom4j解析xml文件
关于xml的知识,及作用什么的就不说了,直接解释如何使用dom4j解析.假如有如下xml: dom4j解析xml其实很简单,只要你有点java基础,知道xml文件.结合下面的xml文件和java代码, ...
- 【收藏用】--切勿转载JAVA 使用Dom4j 解析XML
原帖地址 : http://blog.csdn.NET/yyywyr/article/details/38359049 解析XML的方式有很多,本文介绍使用dom4j解析xml. 1.环境准备 (1) ...
- Java中Dom4j解析XML
与利用DOM.SAX.JAXP机制来解析xml相比DOM4J表现更优秀,具有性能优异.功能强大和极端易用使用的特点,只要懂得DOM基本概念,就可以通过dom4j的api文档来解析xml.dom4j是一 ...
- java三方---->dom4j解析xml数据
Dom4j是一个易用的.开源的库,用于XML,XPath和XSLT.它应用于Java平台,采用了Java集合框架并完全支持DOM,SAX和JAXP.今天我们就开始Dom4j的学习. Dom4j的使用 ...
- java 之 dom4j解析xml
*dom4j,是一个组织,针对xml解析,提供解析器dom4j *dom4j不是javase的一部分,想要使用需要导入dom4j提供的jar包 *第一步:创建lib文件夹,将压缩文件放到此处 *第二步 ...
- 转:在java中使用dom4j解析xml
JAVA 使用Dom4j 解析XML Java DOM4J Parser - Parse XML Document Dom4j下载及使用Dom4j读写XML简介 在java中使用dom4j解析xml ...
- java dom4j解析xml实例(2)
java利用dom4j解析xml 需要的jar包: dom4j官方网站在 http://www.dom4j.org/ 下载dom4j-1.6.1.zip 解开后有两个包,仅操作XML文档的话把dom4 ...
- java dom4j解析xml实例
java利用dom4j解析xml 需要的jar包: dom4j官方网站在 http://www.dom4j.org/ 下载dom4j-1.6.1.zip 解开后有两个包,仅操作XML文档的话把dom4 ...
- java中采用dom4j解析xml文件
一.前言 在最近的开发中用到了dom4j来解析xml文件,以前听说过来解析xml文件的几种标准方式:但是从来的没有应用过来,所以可以在google中搜索dmo4j解析xml文件的方式,学习一下dom4 ...
随机推荐
- oracle高级查询练习题
1. 列出员工表中每个部门的员工数和部门编号 Select deptno,count(*) from emp group by deptno; 补充1:列出员工表中,员工人数大于3的部门编号和员工人 ...
- WebDriverWait等设置等待时间和超时时间
1.显示等待 等待页面加载完成,找到某个条件发生后再继续执行后续代码,如果超过设置时间检测不到则抛出异常 WebDriverWait(driver, timeout, poll_frequency=0 ...
- 不错的silverlight教程
http://www.visifire.com/documentation/Visifire_Documentation/Charts/Reference/Chart_Elements_Referen ...
- AutoLayout自动布局,NSLayoutConstraint 视图约束使用
一.方法 NSLayoutConstraint *constraint = [NSLayoutConstraint constraintWithItem:<#(id)#> attribut ...
- linux 的各个文件夹都是干什么用
http://www.ruanyifeng.com/blog/2012/02/a_history_of_unix_directory_structure.html http://www.pathnam ...
- 【单例模式】Singleton pattern
前言:有很多时候,在一个生命周期中我们只要一个对象就可以了,比如:线程池,缓存,对话框,日志,显卡驱动等等.如果造出多个实例,就会导致许多问题产生,例如:程序的行为异常.资源使用过量,或者说不一致的结 ...
- Sharepoint2013搜索学习笔记之自定义结果源(七)
搜索中心新建好之后在搜索结果页上会默认有所有内容,人员,对话,视频这四个结果分类,每个分类会返回指定范围的搜索结果,这里我再添加了部门日志结果分类,搜索这个分类只会返回部门日志内容类型的搜索结果,要实 ...
- 指针和动态分配内存 (不定长度数组)------新标准c++程序设计
背景: 数组的长度是定义好的,在整个程序中固定不变.c++不允许定义元素个数不确定的数组.例如: int n; int a[n]; //这种定义是不允许的 但是在实际编程中,往往会出现要处理的数据数量 ...
- 20165219 2017-2018-2《Java程序设计》结对编程一 第一周总结
20165219 2017-2018-2<Java程序设计>结对编程一 第一周总结 结对对象 20165219王彦博 20165232何彦达 需求分析 实现一个程序,要求: 1 支持整数运 ...
- 51nod1228 序列求和(伯努利数)
题面 传送门 题解 \(O(n^2)\)预处理伯努利数 不知道伯努利数是什么的可以看看这篇文章 不过这个数据范围拉格朗日差值应该也没问题--吧--大概-- //minamoto #include< ...