dom4j基本操作
DOM4J与利用DOM、SAX、JAXP机制来解析xml相比,DOM4J 表现更优秀,具有性能优异、功能强大和极端易用使用的特点,只要懂得DOM基本概念,就可以通过dom4j的api文档来解析xml。dom4j是一套开源的api。实际项目中,往往选择dom4j来作为解析xml的利器。
针对于XML标准定义,对应于图2-1列出的内容,dom4j提供了以下实现:

常用API
org.dom4j.io.SAXReader
- read 提供多种读取xml文件的方式,返回一个Domcument对象
org.dom4j.Document
- iterator 使用此法获取node
- getRootElement 获取根节点
org.dom4j.Node
- getName 获取node名字,例如获取根节点名称为bookstore
- getNodeType 获取node类型常量值,例如获取到bookstore类型为1——Element
- getNodeTypeName 获取node类型名称,例如获取到的bookstore类型名称为Element
org.dom4j.Element
- attributes 返回该元素的属性列表
- attributeValue 根据传入的属性名获取属性值
- elementIterator 返回包含子元素的迭代器
- elements 返回包含子元素的列表
org.dom4j.Attribute
- getName 获取属性名
- getValue 获取属性值
org.dom4j.Text
- getText 获取Text节点值
org.dom4j.CDATA
- getText 获取CDATA Section值
org.dom4j.Comment
- getText 获取注释
下面做了一个类以如下的XML为例:
<html>
<head>
<title>解析xml例子</title>
<script>
<username>yangrong</username>
<password>123456</password>
</script>
</head>
<body>
<result>0</result>
<form>
<banlce>1000</banlce>
<subID>36242519880716</subID>
</form>
</body>
</html>
import java.util.HashMap;
import java.util.Iterator;
import java.util.Map;
import java.util.List;
import java.io.ByteArrayInputStream;
import java.io.File;
import java.io.FileOutputStream;
import java.io.FileWriter;
import java.io.OutputStreamWriter;
import java.io.UnsupportedEncodingException;
import java.net.URL;
import org.dom4j.Document;
import org.dom4j.DocumentException;
import org.dom4j.DocumentHelper;
import org.dom4j.Element;
import org.dom4j.io.OutputFormat;
import org.dom4j.io.SAXReader;
import org.dom4j.io.XMLWriter; import com.alibaba.fastjson.JSON; public class OperateXml { @SuppressWarnings("unused")
public static void main(String[] args) {
// 下面是需要解析的xml字符串例子
String xmlString = "<html><head><title>解析xml例子</title><script><username>yangrong</username><password>123456</password></script></head><body><result>0</result><form><banlce>1000</banlce><subID>36242519880716</subID></form></body></html>";
//主动创建document对象.
Document document=DocumentHelper.createDocument();//建立document对象,用来操作xml文件 Document testdoc=DocumentHelperreadStringXml(xmlString);
//将文档或节点的XML转化为字符串.
String docXmlText=testdoc.asXML();
String teststring=Documentanalysis1(testdoc);
System.out.print(teststring);
} public static Document DocumentHelperreadStringXml(String xmlContent) {
// DocumentHelper 解析xml字符串
Document document = null;
try {
document = DocumentHelper.parseText(xmlContent);
} catch (DocumentException e1) {
// TODO Auto-generated catch block
e1.printStackTrace();
}
return document;
} public static Document SAXReaderreadStringXml(String xmlContent)
throws DocumentException, UnsupportedEncodingException {
/* SAXReader解析xml字符串 */
Document document = null;
try {
// 读取输入流
SAXReader saxReader = new SAXReader();
document = saxReader.read(new ByteArrayInputStream(xmlContent.getBytes("utf-8")));// 字符串要根据相应的编码转成输入流才能被SAXReader读取。
} catch (Exception ex) {
ex.printStackTrace();
}
return document; } // 读写XML文档主要依赖于org.dom4j.io包,有DOMReader和SAXReader两种方式。因为利用了相同的接口,它们的调用方式是一样的。
public static Document SAXReaderreadfile(String filename) {
/* SAXReader解析xml文件 */
Document document = null;
try {
SAXReader saxReader = new SAXReader();
document = saxReader.read(new File(filename)); // 读取XML文件,获得document对象
} catch (Exception ex) {
ex.printStackTrace();
}
return document;
} public static Document SAXReaderreadurl(URL url) {
Document document = null;
try {
SAXReader saxReader = new SAXReader();
document = saxReader.read(url); // 读取XML文件,获得document对象
} catch (Exception ex) {
ex.printStackTrace();
}
return document;
} // 根节点是xml分析的开始,任何xml分析工作都需要从根开始
@SuppressWarnings("unchecked")
public static String Documentanalysis1(Document doc) {
Map<String, String> uploadMap = new HashMap<String, String>();
Element html = doc.getRootElement();// 获取根结点
Element head = html.element("head");// 获取子结点
Element title = head.element("title");// 获取子子结点
Element script = head.element("script");// 获取子子结点
String text=script.elementText("username");//这个是取得script节点下的username字节点的文字.
// 得到根元素的所有子节点
List<Element> elist = script.elements();
// 遍历所有子节点
for (int i = 0; i < elist.size(); i++) {
Element e = elist.get(i);
uploadMap.put(e.getName(), e.getText());
}
return JSON.toJSONString(uploadMap);
} @SuppressWarnings("rawtypes")
public static String Documentanalysis2(Document doc) {
// 将解析结果存储在HashMap中
Map<String, String> uploadMap = new HashMap<String, String>();
// 得到xml根元素
Element root = doc.getRootElement();
Iterator forms = root.element("body").element("form").elementIterator(); // 获取ticketNotify节点下所有的ticket节点的配置属性,并将其放到Map中
/* // 创建迭代器,用来查找要删除的节点,迭代器相当于指针,指向root下所有的title节点
Iterator iterator =root.elementIterator("title");*/
while (forms.hasNext()) {
Element e = (Element) forms.next();
uploadMap.put(e.getName(), e.getText());
}
return JSON.toJSONString(uploadMap);
} @SuppressWarnings("unchecked")
public static String Documentanalysis3(Document doc) {
// 将解析结果存储在HashMap中
Map<String, String> uploadMap = new HashMap<String, String>();
// 用Document的selectNodes来读取节点,返回list
List<Element> elementList = doc.selectNodes("/html/body/form/*");
/* 选取未知节点
XPath 通配符可用来选取未知的 XML 元素。
通配符 描述
* 匹配任何元素节点。
@* 匹配任何属性节点。
node() 匹配任何类型的节点。*/
for (Element e : elementList) {
uploadMap.put(e.getName(), e.getText());
}
return JSON.toJSONString(uploadMap);
}
// 添加xml节点,addroot为即将插入节点的父节点
public static void addElement(Element addroot, String elementname, String elementvalue) {
Element childelement = addroot.addElement(elementname);
childelement.setText(elementvalue);
}
// 删除xml节点,addroot为即将删除节点的父节点
public static void addElement(Element addroot, String elementname) {
addroot.remove(addroot.element(elementname));
}
//写入XML文件,可设置编码方式设置encodetype为"",默认为UTF-8
public static boolean doc2XmlFile(Document document, String filename,String encodetype) {
boolean flag = true;
try {
//通过XMLWriter将Document对象表示的XML树写入指定的文件
XMLWriter writer = new XMLWriter(new OutputStreamWriter(new FileOutputStream(filename), "".equals(encodetype)?"UTF-8":encodetype));
writer.write(document);
writer.close();
} catch (Exception ex) {
flag = false;
ex.printStackTrace();
}
System.out.println(flag);
return flag;
}
//创建xml文件
public static void WriterXmltoFile(Document document, String filename,String encodetype) {
OutputFormat format = OutputFormat.createPrettyPrint();
format.setEncoding(encodetype); // 指定XML编码
try{
XMLWriter writer=new XMLWriter(new FileWriter(new File(filename)),format);
writer.write(document);
writer.close();
}catch(Exception e){
e.printStackTrace();
}
}
}
Element类
|
getQName() |
元素的QName对象 |
|
getNamespace() |
元素所属的Namespace对象 |
|
getNamespacePrefix() |
元素所属的Namespace对象的prefix |
|
getNamespaceURI() |
元素所属的Namespace对象的URI |
|
getName() |
元素的local name |
|
getQualifiedName() |
元素的qualified name |
|
getText() |
元素所含有的text内容,如果内容为空则返回一个空字符串而不是null |
|
getTextTrim() |
元素所含有的text内容,其中连续的空格被转化为单个空格,该方法不会返回null |
|
attributeIterator() |
元素属性的iterator,其中每个元素都是Attribute对象 |
|
attributeValue() |
元素的某个指定属性所含的值 |
|
elementIterator() |
元素的子元素的iterator,其中每个元素都是Element对象 |
|
element() |
元素的某个指定(qualified name或者local name)的子元素 |
|
elementText() |
元素的某个指定(qualified name或者local name)的子元素中的text信息 |
|
getParent |
元素的父元素 |
|
getPath() |
元素的XPath表达式,其中父元素的qualified name和子元素的qualified name之间使用"/"分隔 |
|
isTextOnly() |
是否该元素只含有text或是空元素 |
|
isRootElement() |
是否该元素是XML树的根节点 |
dom4j基本操作的更多相关文章
- 使用dom4j技术对xml文件的基本操作
1.pojo类:Notice package com.green.notice.storage; import java.util.ArrayList; import java.util.List; ...
- dom4j的基本操作
/** * 建立一个XML文档,文档名由输入属性决定 * @param filename 需建立的文件名 * @return 返回操作结果, 0表失败, 1表成功 */ import java.io. ...
- 学生管理系统增删查基本操作(dom4j/sax技术)
基本代码: student.xml <?xml version="1.0" encoding="UTF-8"?><student> &l ...
- # java对xml文件的基本操作
下面是简单的总结三种常用的java对xml文件的操作 1. dom方式对xml进行操作,这种操作原理是将整个xml文档读入内存总,在内存中进行操作,当xml文档非常庞大的时候就会出现内存溢出的异常,这 ...
- dom4j学习总结(一)
dom4j学习总结(一) (一)创建Document的基本操作 /** * xml基本操作 */ public void BaseOperation(){ //创建一个document Doc ...
- xml&dom_sax&dom4j的常见操作
<? xml version =”1.0” encoding=”GB2312”?> <!-- 学生信息—><?xml-stylesheet type=”text/css” ...
- Key/Value之王Memcached初探:二、Memcached在.Net中的基本操作
一.Memcached ClientLib For .Net 首先,不得不说,许多语言都实现了连接Memcached的客户端,其中以Perl.PHP为主. 仅仅memcached网站上列出的语言就有: ...
- XML技术之DOM4J解析器
由于DOM技术的解析,存在很多缺陷,比如内存溢出,解析速度慢等问题,所以就出现了DOM4J解析技术,DOM4J技术的出现大大改进了DOM解析技术的缺陷. 使用DOM4J技术解析XML文件的步骤? pu ...
- Android Notification 详解(一)——基本操作
Android Notification 详解(一)--基本操作 版权声明:本文为博主原创文章,未经博主允许不得转载. 微博:厉圣杰 源码:AndroidDemo/Notification 文中如有纰 ...
随机推荐
- JavaScript图形实例:平面镶嵌图案
用形状.大小完全相同的一种或几种平面图形进行拼接,彼此之间不留空隙.不重叠地铺成一片,就叫做这几种图形的平面镶嵌. 1.用一种多边形实现的平面镶嵌图案 我们可以采用正三角形.正方形或正六边形实现平面镶 ...
- SSRF漏洞简单分析
什么是SSRF漏洞 SSRF(服务器端请求伪造)是一种由攻击者构造请求,服务器端发起请求的安全漏洞,所以,一般情况下,SSRF攻击的目标是外网无法访问的内部系统. SSRF漏洞形成原理. SSRF的形 ...
- Ethical Hacking - GAINING ACCESS(14)
CLIENT SIDE ATTACKS Protecting against smart delivery methods Ensure you're not being MITM'ed -> ...
- Goorm永久免费的VPS
简介 咱在LOC(某知名主机论坛)看到的,当个容器玩玩还是不错的,不过10分钟后会休眠,目前还没有大佬可以解决,可以使用SSH连接,适合折腾,不适合建站等生产环境操作,请注意.https://www. ...
- StringBuffer类和StringBuilder类
StringBuffer类和StringBuilder类 三者比较 String 不可变字符序列 底层用char[]存储 StringBuffer 可变的字符序列 线程安全的 效率低 底层结构使用ch ...
- 三面拿杭州研究院50offer:面对这些问题,你都能做到嘛??
5G的到来证明了互联网行业发展一如既往的快,作为一名开发人员(Java岗)梦想自然是互联网行业的大厂,这次我的一个学员拿到了杭州的一个研究院offer,透露一下,年薪50多万,保底16,在这里分享一拨 ...
- 面试题四十二:连续子数组的最大和,要求时间复杂度为 n
方法一:举例分析数组的规律,累加数组逐步保存最大值:累加中和<0,则遗弃前面的累加和:重新开始: int FindMaxArray(int [] A) { if(A= ...
- 今天发现郭的华为手机无法读写sd卡,找到了这个方法
https://bbs.csdn.net/topics/391985867?page=1 华为P9是android 6.0 的==在API23+以上也就是安卓6.0以上的,进行了权限管理不止要在And ...
- org.springframework.beans.factory.UnsatisfiedDependencyException异常
注解配置不完整 如Service实现类没有加 * @Service * @Transactional
- 不想得手指关节炎?帮你提炼IDEA常用代码补全操作
一.常用的代码补全操作 1..for和.fori(for 循环遍历) 输入args.for回车(args是一个数组或集合类),则会生成for循环遍历: 输入args.fori回车,则会生成带有索引的f ...