XML的两种解析方式

JDK提供的XML解析方式分为两种：DOM方式和SAX方式
DOM：Document Object Model。需要读取整个XML文档，先需要在内存中构架代表整个DOM树的Document对象，可以进行随机访问. 需要考虑内存.适合增删改
SAX：Simple API for XML。采用事件驱动的方式解析XML文件，边读边对文档进行处理.适合读取

其他的xml解析包:Dom4J, PullParser(安卓)

Dom4J实现类似SAX方式, API类似DOM方式

DOM @JDK

public class DomTest {

    // 解析xml获取document对象

    private Document getDocument() throws ParserConfigurationException,

            SAXException, IOException {

        // 1. 获得工厂

        DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance();

        // 2. 获得 builder对象

        DocumentBuilder builder = factory.newDocumentBuilder();

        // 3. 解析xml得带document对象

        Document document = builder.parse("src/book.xml");

        return document;

    }

    // 将内存中的document对象写回xml文件中

    private void writeBack2Xml(Document document)

            throws TransformerFactoryConfigurationError,

            TransformerConfigurationException, TransformerException {

        TransformerFactory factory = TransformerFactory.newInstance();

        Transformer transformer = factory.newTransformer();

        transformer.transform(new DOMSource(document), new StreamResult("src/book.xml"));

    }

    // 读取节点文本

    @Test

    public void testReadContent() throws Exception{

        Document document = getDocument();

        //根据标签名获得节点列表

        NodeList nodeList = document.getElementsByTagName("书");

        System.out.println("长度 : " + nodeList.getLength());

        // 返回第一个节点

        Node firstNode = nodeList.item(0);

        // 返回文本内容

        String result  = firstNode.getTextContent();

        System.out.println(result);

    }

    // 读取节点的属性值

    @Test

    public void testReadAttribute() throws Exception{

        Document document = getDocument();

        NodeList nodeList = document.getElementsByTagName("书");

        // 确认本Node为元素节点后加强转

        Node node = nodeList.item(0);

        if (node instanceof Element) {

            Element firstElement = (Element) node;

            String result = firstElement.getAttribute("出版社");

            System.out.println(result);

        }

    }

    // 添加节点

    @Test

    public void testAddPrice() throws Exception, SAXException, IOException{

        Document document = getDocument();

        Node firstNode = document.getElementsByTagName("书").item(0);

        Element newElement = document.createElement("售价");

        newElement.setTextContent("79.00元");

        firstNode.appendChild(newElement);

        writeBack2Xml(document);  //写回

    }

    // 删除节点

    @Test

    public void testDelete() throws Exception, SAXException, IOException{

        Document document = getDocument();

        NodeList priceNodeList = document.getElementsByTagName("售价");

        for (int i = 0; i < priceNodeList.getLength(); i++) {

            Node node = priceNodeList.item(i);

            if("39.00元".equals(node.getTextContent())){

                // 从父节点删除子节点, 类似dom的api

                node.getParentNode().removeChild(node);

            }

        }

        writeBack2Xml(document);

    }

    // 打印所有元素节点的名称

    @Test

    public void testPrintAllElementsName() throws Exception, SAXException, IOException{

        Document document = getDocument();

        // 递归打印

        printAllElementsName(document);

    }

    public void printAllElementsName(Node node){

        // 打印本节点

        if(Node.ELEMENT_NODE==node.getNodeType()){

            System.out.println(node.getNodeName());

        }

        // 处理子节点

        NodeList childNodes = node.getChildNodes();

        for (int i = 0; i < childNodes.getLength(); i++) {  //递归出口: 循环完成

            Node item = childNodes.item(i);

            printAllElementsName(item);

        }

    }

}

SAX @JDK

public class SaxTest {

    public static void main(String[] args) throws Exception, SAXException {

        SAXParserFactory factory = SAXParserFactory.newInstance();

        SAXParser parser = factory.newSAXParser();

        XMLReader reader = parser.getXMLReader();

        reader.setContentHandler(new MyDefaultHandler());

        reader.parse("src/book.xml");

    }

}

class MyDefaultHandler extends DefaultHandler {

    // 作为被调用方, 流程不是这边控制, 所以定义状态位或计数器来标记流程进行的位置

    private boolean isPrice = false;

    private int count =1;

    @Override

    public void startElement(String uri, String localName, String qName,    // qName标签名

            Attributes attributes) throws SAXException {

        if ("售价".equals(qName)) {

            isPrice = true;

            count++;

        }

    }

    @Override

    public void endElement(String uri, String localName, String qName)

            throws SAXException {

        if ("售价".equals(qName)) {

            isPrice = false;

        }

    }

    // 读到文本了

    @Override

    public void characters(char[] ch, int start, int length)

            throws SAXException {

        if (isPrice&&count==3) {

            System.out.println("文本: " + new String(ch, start, length));

        }

    }

}

Dom4J

public class Dom4JTest {

    private Document getDocument() throws DocumentException {

        // 获得 代表 xml 文件的 document 对象

        SAXReader reader = new SAXReader();

        Document document = reader.read("src/book.xml");

        return document;

    }

    private void wirteBack2Xml(Document document) throws UnsupportedEncodingException, FileNotFoundException, IOException {

        OutputFormat format = OutputFormat.createPrettyPrint();

        format.setEncoding("UTF-8");

        XMLWriter writer = new XMLWriter(new FileOutputStream("src/book.xml"), format);

        writer.write(document);

        writer.close();

    }

    // 读取节点的文本内容

    // 由于 dom4j采用sax方式去解析的xml文档, 所以dom4j不能直接获得深层次的某个节点, 需要一级级获得

    @Test

    public void testReadContent() throws Exception{

        Document document = getDocument();

        Element rootElement = document.getRootElement();

        Element firstLevelElement = rootElement.element("ele1");

        Element secondLevelElement = firstLevelElement.element("ele2");

        String value = secondLevelElement.getText();

        System.out.println(value);

    }

    // 读取属性值

    @Test

    public void testReadAttribute() throws Exception{

        Document document = getDocument();

        Element rootElement = document.getRootElement();

        List<Element> list = rootElement.elements("书");

        Element secondElement = list.get(1);

        Attribute attribute = secondElement.attribute("出版社");

        String value = attribute.getValue();

        System.out.println(value);

    }

    // 添加节点

    @Test

    public void testAddPrice() throws Exception{

        Document document = getDocument();

        Element rootElement = document.getRootElement();

        Element secondBookElement = (Element) rootElement.elements("书").get(1);

        // 创建新节点

        secondBookElement.addElement("newEle").setText("this is new Element");

        wirteBack2Xml(document);

    }

    // 删除节点

    @Test

    public void testDeletePrice() throws Exception{

        Document document = getDocument();

        Element rootElement = document.getRootElement();

        Element secondBookElement = (Element) rootElement.elements("书").get(1);

        Element targetBookPrice = (Element) secondBookElement.elements("售价").get(0);

        // 拿到父节点, 然后删除这个子节点

        targetBookPrice.getParent().remove(targetBookPrice);

        wirteBack2Xml(document);

    }

}

XML的两种解析方式的更多相关文章

xml中俩种解析方式
两种解析方式 1.from xml.etree import ElementTree as ET 利用ElementTree模块下的xml方法可以把一个字符串类型的东西转换成Element类,从而利用 ...
xml常用四种解析方式优缺点的分析×××××
xml常用四种解析方式优缺点的分析博客分类: xml 最近用得到xml的解析方式,于是就翻了翻自己的笔记同时从网上查找了资料,自己在前人的基础上总结了下,贴出来大家分享下. 首先介绍一下xml语 ...
XML 的4种解析方式
在上一篇博客中,我们介绍了什么是 XML ,http://www.cnblogs.com/ysocean/p/6901008.html,那么这一篇博客我们介绍如何来解析 XML . 部分文档引用:ht ...
Android平台中实现对XML的三种解析方式
本文介绍在Android平台中实现对XML的三种解析方式. XML在各种开发中都广泛应用,Android也不例外.作为承载数据的一个重要角色,如何读写XML成为Android开发中一项重要的技能. 在 ...
Javaweb学习笔记——（六）——————xml中jaxp两种解析方式和dom4j运用
1.xml的scheam约束 dtd的语法:<!ElEMENT 元素名称约束> **schema符合xml的语法,xml语句 **一个xml中可以有多个schema,多个schema使用 ...
XML解析——Java中XML的四种解析方式
XML是一种通用的数据交换格式,它的平台无关性.语言无关性.系统无关性.给数据集成与交互带来了极大的方便.XML在不同的语言环境中解析方式都是一样的,只不过实现的语法不同而已. XML的解析方式分为四 ...
XML解析——Java中XML的四种解析方式（转载 by 龍清扬）
XML是一种通用的数据交换格式,它的平台无关性.语言无关性.系统无关性.给数据集成与交互带来了极大的方便.XML在不同的语言环境中解析方式都是一样的,只不过实现的语法不同而已. XML的解析方式分为四 ...
xml的四种解析方式（转载）
众所周知,现在解析XML的方法越来越多,但主流的方法也就四种,即:DOM.SAX.JDOM和DOM4J 下面首先给出这四种方法的jar包下载地址 DOM:在现在的Java JDK里都自带了,在xml- ...
C#读写XML的两种一般方式
针对XML文档的应用编程接口中,一般有两种模型:W3C制定的DOM(Document Object Method,文档对象模型)和流模型. 流模型的两种变体:"推"模型(XML的简 ...

随机推荐

tensorflow 中 softmax_cross_entropy_with_logits 与 sparse_softmax_cross_entropy_with_logits 的区别
http://stackoverflow.com/questions/37312421/tensorflow-whats-the-difference-between-sparse-softmax-c ...
python16_day18【Django_Form表单、分页】
一.表单 Django的Form主要具有一下几大功能: 生成HTML标签验证用户数据(显示错误信息) HTML Form提交保留上次提交数据初始化页面显示内容 1.Form类创建Form类时,主 ...
Python基础学习之函数
阅读目录第一篇: 函数初识第二篇: 函数命名空间作用域闭包第三篇: 装饰器第四篇: 装饰器面试题错误点第五篇: 迭代器生成器第六篇: 生成器进阶第七篇: 递归第八篇 ...
jQuery文档节点处理，克隆，each循环，动画效果，插件
文档节点处理 //创建一个标签对象 $("<p>") //内部插入 $("").append(content|fn) ----->$(&quo ...
Delphi 正则表达式之TPerlRegEx 类的属性与方法(7): Split 函数
Delphi 正则表达式之TPerlRegEx 类的属性与方法(7): Split 函数 //字符串分割: Split var reg: TPerlRegEx; List: TStrings; ...
SOAPUI 压力测试的指标项说明
soapUI Pro指标项说明: Test Step Sets the startup delay for each thread (in milliseconds), setting to ...
Linux信号signal处理机制
信号机制是进程之间相互传递消息的一种方法,信号全称为软中断信号,也有人称作软中断.从它的命名可以看出,它的实质和使用很象中断.所以,信号可以说是进程控制的一部分. 一.信号的基本概念 ...
DataNode启动不成功——java.net.BindException: Port in use: localhost:0 Caused by: java.net.BindException: Cannot assign requested address解决办法
爱折腾的人总是会出线各种奇怪的问题.记得之前听一位大师讲过,我们不能踩完前进路上的所有坑前进,而应该学会怎样避开前进路上的坑,踩得坑越多,可能你的经验越丰富,但是付出的时间代价可能不是经验能换来的.我 ...
LeetCode: Find Largest Value in Each Tree Row
BFS /** * Definition for a binary tree node. * public class TreeNode { * int val; * TreeNode left; * ...
LigerUI v1.2.4 LigerGrid 横轴滚动条
1.设置隐藏列的宽度,不要等于0 2.设置body样式添加overflow: hidden;

XML的两种解析方式

XML的两种解析方式的更多相关文章

随机推荐

热门专题