JDK提供的XML解析方式分为两种:DOM方式和SAX方式
DOM:Document Object Model。需要读取整个XML文档,先需要在内存中构架代表整个DOM树的Document对象,可以进行随机访问. 需要考虑内存.适合增删改
SAX:Simple API for XML。采用事件驱动的方式解析XML文件,边读边对文档进行处理.适合读取

其他的xml解析包:Dom4J, PullParser(安卓)

Dom4J实现类似SAX方式, API类似DOM方式

DOM @JDK

public class DomTest {

    // 解析xml获取document对象
private Document getDocument() throws ParserConfigurationException,
SAXException, IOException {
// 1. 获得工厂
DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance();
// 2. 获得 builder对象
DocumentBuilder builder = factory.newDocumentBuilder();
// 3. 解析xml得带document对象
Document document = builder.parse("src/book.xml");
return document;
} // 将内存中的document对象写回xml文件中
private void writeBack2Xml(Document document)
throws TransformerFactoryConfigurationError,
TransformerConfigurationException, TransformerException { TransformerFactory factory = TransformerFactory.newInstance();
Transformer transformer = factory.newTransformer();
transformer.transform(new DOMSource(document), new StreamResult("src/book.xml"));
} // 读取节点文本
@Test
public void testReadContent() throws Exception{
Document document = getDocument();
//根据标签名获得节点列表
NodeList nodeList = document.getElementsByTagName("书");
System.out.println("长度 : " + nodeList.getLength());
// 返回第一个节点
Node firstNode = nodeList.item(0);
// 返回文本内容
String result = firstNode.getTextContent();
System.out.println(result);
} // 读取节点的属性值
@Test
public void testReadAttribute() throws Exception{
Document document = getDocument();
NodeList nodeList = document.getElementsByTagName("书");
// 确认本Node为元素节点后加强转
Node node = nodeList.item(0);
if (node instanceof Element) {
Element firstElement = (Element) node;
String result = firstElement.getAttribute("出版社");
System.out.println(result);
}
} // 添加节点
@Test
public void testAddPrice() throws Exception, SAXException, IOException{
Document document = getDocument();
Node firstNode = document.getElementsByTagName("书").item(0);
Element newElement = document.createElement("售价");
newElement.setTextContent("79.00元");
firstNode.appendChild(newElement);
writeBack2Xml(document); //写回
} // 删除节点
@Test
public void testDelete() throws Exception, SAXException, IOException{
Document document = getDocument();
NodeList priceNodeList = document.getElementsByTagName("售价");
for (int i = 0; i < priceNodeList.getLength(); i++) {
Node node = priceNodeList.item(i);
if("39.00元".equals(node.getTextContent())){
// 从父节点删除子节点, 类似dom的api
node.getParentNode().removeChild(node);
}
}
writeBack2Xml(document);
} // 打印所有元素节点的名称
@Test
public void testPrintAllElementsName() throws Exception, SAXException, IOException{
Document document = getDocument();
// 递归打印
printAllElementsName(document);
} public void printAllElementsName(Node node){
// 打印本节点
if(Node.ELEMENT_NODE==node.getNodeType()){
System.out.println(node.getNodeName());
}
// 处理子节点
NodeList childNodes = node.getChildNodes();
for (int i = 0; i < childNodes.getLength(); i++) { //递归出口: 循环完成
Node item = childNodes.item(i);
printAllElementsName(item);
}
}
}

SAX @JDK

public class SaxTest {

    public static void main(String[] args) throws Exception, SAXException {

        SAXParserFactory factory = SAXParserFactory.newInstance();
SAXParser parser = factory.newSAXParser();
XMLReader reader = parser.getXMLReader();
reader.setContentHandler(new MyDefaultHandler());
reader.parse("src/book.xml");
}
} class MyDefaultHandler extends DefaultHandler { // 作为被调用方, 流程不是这边控制, 所以定义状态位或计数器来标记流程进行的位置
private boolean isPrice = false;
private int count =1; @Override
public void startElement(String uri, String localName, String qName, // qName标签名
Attributes attributes) throws SAXException {
if ("售价".equals(qName)) {
isPrice = true;
count++;
}
} @Override
public void endElement(String uri, String localName, String qName)
throws SAXException {
if ("售价".equals(qName)) {
isPrice = false;
}
} // 读到文本了
@Override
public void characters(char[] ch, int start, int length)
throws SAXException {
if (isPrice&&count==3) {
System.out.println("文本: " + new String(ch, start, length));
}
}
}

Dom4J

public class Dom4JTest {

    private Document getDocument() throws DocumentException {
// 获得 代表 xml 文件的 document 对象
SAXReader reader = new SAXReader();
Document document = reader.read("src/book.xml");
return document;
} private void wirteBack2Xml(Document document) throws UnsupportedEncodingException, FileNotFoundException, IOException {
OutputFormat format = OutputFormat.createPrettyPrint();
format.setEncoding("UTF-8");
XMLWriter writer = new XMLWriter(new FileOutputStream("src/book.xml"), format);
writer.write(document);
writer.close();
} // 读取节点的文本内容
// 由于 dom4j采用sax方式去解析的xml文档, 所以dom4j不能直接获得深层次的某个节点, 需要一级级获得
@Test
public void testReadContent() throws Exception{ Document document = getDocument(); Element rootElement = document.getRootElement();
Element firstLevelElement = rootElement.element("ele1");
Element secondLevelElement = firstLevelElement.element("ele2"); String value = secondLevelElement.getText();
System.out.println(value);
} // 读取属性值
@Test
public void testReadAttribute() throws Exception{ Document document = getDocument(); Element rootElement = document.getRootElement(); List<Element> list = rootElement.elements("书");
Element secondElement = list.get(1);
Attribute attribute = secondElement.attribute("出版社"); String value = attribute.getValue();
System.out.println(value);
} // 添加节点
@Test
public void testAddPrice() throws Exception{ Document document = getDocument(); Element rootElement = document.getRootElement();
Element secondBookElement = (Element) rootElement.elements("书").get(1);
// 创建新节点
secondBookElement.addElement("newEle").setText("this is new Element"); wirteBack2Xml(document);
} // 删除节点
@Test
public void testDeletePrice() throws Exception{ Document document = getDocument();
Element rootElement = document.getRootElement();
Element secondBookElement = (Element) rootElement.elements("书").get(1);
Element targetBookPrice = (Element) secondBookElement.elements("售价").get(0); // 拿到父节点, 然后删除这个子节点
targetBookPrice.getParent().remove(targetBookPrice);
wirteBack2Xml(document);
}
}

XML的两种解析方式的更多相关文章

  1. xml中俩种解析方式

    两种解析方式 1.from xml.etree import ElementTree as ET 利用ElementTree模块下的xml方法可以把一个字符串类型的东西转换成Element类,从而利用 ...

  2. xml常用四种解析方式优缺点的分析×××××

    xml常用四种解析方式优缺点的分析 博客分类: xml   最近用得到xml的解析方式,于是就翻了翻自己的笔记同时从网上查找了资料,自己在前人的基础上总结了下,贴出来大家分享下. 首先介绍一下xml语 ...

  3. XML 的4种解析方式

    在上一篇博客中,我们介绍了什么是 XML ,http://www.cnblogs.com/ysocean/p/6901008.html,那么这一篇博客我们介绍如何来解析 XML . 部分文档引用:ht ...

  4. Android平台中实现对XML的三种解析方式

    本文介绍在Android平台中实现对XML的三种解析方式. XML在各种开发中都广泛应用,Android也不例外.作为承载数据的一个重要角色,如何读写XML成为Android开发中一项重要的技能. 在 ...

  5. Javaweb学习笔记——(六)——————xml中jaxp两种解析方式和dom4j运用

    1.xml的scheam约束 dtd的语法:<!ElEMENT 元素名称 约束> **schema符合xml的语法,xml语句 **一个xml中可以有多个schema,多个schema使用 ...

  6. XML解析——Java中XML的四种解析方式

    XML是一种通用的数据交换格式,它的平台无关性.语言无关性.系统无关性.给数据集成与交互带来了极大的方便.XML在不同的语言环境中解析方式都是一样的,只不过实现的语法不同而已. XML的解析方式分为四 ...

  7. XML解析——Java中XML的四种解析方式(转载 by 龍清扬)

    XML是一种通用的数据交换格式,它的平台无关性.语言无关性.系统无关性.给数据集成与交互带来了极大的方便.XML在不同的语言环境中解析方式都是一样的,只不过实现的语法不同而已. XML的解析方式分为四 ...

  8. xml的四种解析方式(转载)

    众所周知,现在解析XML的方法越来越多,但主流的方法也就四种,即:DOM.SAX.JDOM和DOM4J 下面首先给出这四种方法的jar包下载地址 DOM:在现在的Java JDK里都自带了,在xml- ...

  9. C#读写XML的两种一般方式

    针对XML文档的应用编程接口中,一般有两种模型:W3C制定的DOM(Document Object Method,文档对象模型)和流模型. 流模型的两种变体:"推"模型(XML的简 ...

随机推荐

  1. mysql什么情况下使用索引

    表的主关键字 自动建立唯一索引 如zl_yhjbqk(用户基本情况)中的hbs_bh(户标识编号) 表的字段唯一约束 ORACLE利用索引来保证数据的完整性 如lc_hj(流程环节)中的lc_bh+h ...

  2. python中如何去掉unicode编码前面的u?

    1.列表类型(用join方法) myUlist = [u'AB', u'AB', u'AB', u'AB'] print myUlist print ", ".join(myUli ...

  3. 系列文章(三):WAPI为无线局域网WLAN安全而生——By Me

    导读:无线局域网(又称为WLAN,Wireless Local Area Network),其应用领域不断拓展,无线接入所具有的前所未有的连接性和自动化能够为人们带来巨大的便利和商机.与此同时,在信息 ...

  4. Linux学习笔记—文件与文件系统的压缩与打包(转载)

    压缩文件的用途与技术 例如,计算机都是以byte单位来计量的,1byte占8bit.如果存储数字1,那么1byte就会空出7bit.采用一定的计算方式,压缩这些空间可以大大降低文件存储. Linux系 ...

  5. 关于shared pool的深入探讨(四)

    我们进一步来讨论一下shared pool的处理: 先进行相应查询,获得测试数据: [oracle@jumper udump]$ sqlplus "/ as sysdba" SQL ...

  6. Hadoop十年解读与发展预测

    编者按:Hadoop于2006年1月28日诞生,至今已有10年,它改变了企业对数据的存储.处理和分析的过程,加速了大数据的发展,形成了自己的极其火爆的技术生态圈,并受到非常广泛的应用.在2016年Ha ...

  7. CRM——插件流程回顾

    1. Django项目启动 自动加载文件 制作启动文件 1. 注册strak 在apps.py 类里面增加如下 def ready(self): from django.utils.module_lo ...

  8. DELPHI在标题栏上增加按钮

    Delphi代码 unit Unit1; interface uses SysUtils, WinTypes, WinProcs, Messages, Classes, Graphics, Contr ...

  9. k8s使用ceph作为后端存储挂载

    一.在ceph集群上操作: 1.创建池(主要使用存储类来进行持久卷的挂载,其他的挂载方式不好使也太麻烦):ceph osd pool create k8s 64 二.在k8s上操作: 1.安装客户端( ...

  10. 笔记-CSS空背景图片会导致页面被加载两次

    如果页面样式的背景图片路径设置为'' 或 '#', 会导致页面被重复加载两次 (Chrome.56.0.2924.87 测试) 因为:空图片路径属性值,默认加载当前页面的URL作为图片路径 Safar ...