SAX解析xml (遍历DOM树各节点)

本文参考 http://yangjunfeng.iteye.com/blog/401377

1. books.xml

 <?xml version="1.0" encoding="UTF-8"?>

 <bk:books count="3" xmlns:bk="http://test.org/books">

     <!--books's comment -->

     <bk:book id="1">

         <bk:name>Thinking in JAVA</bk:name>

     </bk:book>

     <bk:book id="2">

         <bk:name>Core JAVA2</bk:name>

     </bk:book>

     <bk:book id="3">

         <bk:name>C++ primer</bk:name>

         <addr:address xmlns:addr="http://test.org/address">

             <addr:state>China</addr:state>

             <addr:city>ShangHai</addr:city>

         </addr:address>

     </bk:book>

 </bk:books>

xml文件基本结构：

<books>Text文本节点("\n\t"换行+制表符)

　　<book>Text文本节点("\n\t\t"换行+2个制表符)

　　　　<name>Text文本节点("Thinking in JAVA")</name>Text文本节点("\n\t"换行+制表符)

　　</book>

.......

</books>

2. 使用SAX api 解析xml

 package sax.parsing.example;

 import java.io.FileInputStream;

 import java.io.FileNotFoundException;

 import java.io.IOException;

 import java.io.Reader;

 import org.testng.annotations.Test;

 import org.xml.sax.Attributes;

 import org.xml.sax.ContentHandler;

 import org.xml.sax.InputSource;

 import org.xml.sax.Locator;

 import org.xml.sax.SAXException;

 import org.xml.sax.XMLReader;

 import org.xml.sax.helpers.XMLReaderFactory;

 import bsh.This;

 class MyContentHandler implements ContentHandler {

     private StringBuffer stringBuffer;

     int frontBlankCount = 0;

     public String toBlankString(int count) {

         StringBuffer buffer = new StringBuffer();

         for (int i=0; i<count; i++)

             buffer.append("    ");

         return buffer.toString();

     }

     @Override

     public void setDocumentLocator(Locator locator) {

         System.out.println(this.toBlankString(this.frontBlankCount)

                 + ">>> set document_locator : (lineNumber = " + locator.getLineNumber()

                 + ", columnNumber = " + locator.getColumnNumber()

                 + ", systemId = " + locator.getSystemId()

                 + ". publicId = " + locator.getPublicId()

                 + ")"

                 );

     }

     @Override

     public void startDocument() throws SAXException {

         System.out.println(this.toBlankString(frontBlankCount) + ">>> start document");

     }

     @Override

     public void endDocument() throws SAXException {

         System.out.print(this.toBlankString(frontBlankCount) + ">>> end document");

     }

     @Override

     public void startPrefixMapping(String prefix, String uri) throws SAXException {

         System.out.println("\n" + this.toBlankString(this.frontBlankCount)

                 + ">>> start prefix_mapping : xmlns:" + prefix + "=\"" + uri + "\"");

     }

     @Override

     public void endPrefixMapping(String prefix) throws SAXException {

         System.out.print("\n" + this.toBlankString(this.frontBlankCount) + ">>> end prefix_mapping : " + prefix);

     }

     @Override

     public void startElement(String uri, String localName, String qName, Attributes atts) throws SAXException {

         System.out.print(this.toBlankString(this.frontBlankCount++) + ">>> start element : "

                     + qName + "(" + uri + ")"

                     );

     }

     @Override

     public void endElement(String uri, String localName, String qName) throws SAXException {

         System.out.print(this.toBlankString(--this.frontBlankCount) + ">>> end element : "

                 + qName + "(" + uri + ")"

                 );

     }

     /**

      *  Text文本节点 处理

      */

     @Override

     public void characters(char[] ch, int start, int length) throws SAXException {

         StringBuffer buffer = new StringBuffer();

         for (int i=start; i<start+length; i++) {

             switch (ch[i]) {

                 case '\\': buffer.append("\\\\");break;

                 case '\r': buffer.append("\\r");break;

                 case '\n': buffer.append("\\n");break;

                 case '\t': buffer.append("\\t");break;

                 case '\"': buffer.append("\\\"");break;

                 default: buffer.append(ch[i]);

             }

         }

         System.out.println("\t>>> characters(" + length + "): " + buffer.toString());

     }

     @Override

     public void ignorableWhitespace(char[] ch, int start, int length) throws SAXException {

         StringBuffer buffer = new StringBuffer();

         for (int i=start; i<start+length; i++) {

             switch (ch[i]) {

                 case '\\': buffer.append("\\\\");break;

                 case '\r': buffer.append("\\r");break;

                 case '\n': buffer.append("\\n");break;

                 case '\t': buffer.append("\\t");break;

                 case '\"': buffer.append("\\\"");break;

                 default: buffer.append(ch[i]);

             }

         }

         System.out.print(this.toBlankString(frontBlankCount)

                 + ">>> ignorable whitespace(" + length + "): " + buffer.toString());

     }

     @Override

     public void processingInstruction(String target, String data) throws SAXException {

         System.out.print(this.toBlankString(this.frontBlankCount)

                 + ">>> process instruction : (target = \"" + target + "\", data = \"" + data + ")");

     }

     @Override

     public void skippedEntity(String name) throws SAXException {

         System.out.print(this.toBlankString(this.frontBlankCount) + ">>> skipped_entity : " + name);

     }

 }

 public class SaxTest {

     @Test

     public void test() throws SAXException, FileNotFoundException, IOException {

         XMLReader reader = XMLReaderFactory.createXMLReader();

         reader.setFeature("http://xml.org/sax/features/validation", true);

         reader.setFeature("http://xml.org/sax/features/namespaces", true);

         reader.setContentHandler(new MyContentHandler());

         reader.parse(new InputSource(new FileInputStream("src/sax/parsing/example/books.xml")));

     }

 }

输出结果：

>>> set document_locator : (lineNumber = 1, columnNumber = 1, systemId = null. publicId = null)
>>> start document
[Error] :5:10: Document is invalid: no grammar found.
[Error] :5:10: Document root element "bk:books", must match DOCTYPE root "null".

>>> start prefix_mapping : xmlns:bk="http://test.org/books"
>>> start element : bk:books(http://test.org/books) >>> characters(2): \n\t
　　>>> start element : bk:book(http://test.org/books) >>> characters(3): \n\t\t
　　　　>>> start element : bk:name(http://test.org/books) >>> characters(16): Thinking in JAVA
　　　　>>> end element : bk:name(http://test.org/books) >>> characters(2): \n\t
　　>>> end element : bk:book(http://test.org/books) >>> characters(2): \n\t
　　>>> start element : bk:book(http://test.org/books) >>> characters(3): \n\t\t
　　　　>>> start element : bk:name(http://test.org/books) >>> characters(10): Core JAVA2
　　　　>>> end element : bk:name(http://test.org/books) >>> characters(2): \n\t
　　>>> end element : bk:book(http://test.org/books) >>> characters(2): \n\t
　　>>> start element : bk:book(http://test.org/books) >>> characters(3): \n\t\t
　　　　>>> start element : bk:name(http://test.org/books) >>> characters(10): C++ primer
　　　　>>> end element : bk:name(http://test.org/books) >>> characters(3): \n\t\t

　　　　>>> start prefix_mapping : xmlns:addr="http://test.org/address"
　　　　>>> start element : addr:address(http://test.org/address) >>> characters(4): \n\t\t\t
　　　　　　>>> start element : addr:state(http://test.org/address) >>> characters(5): China
　　　　　　>>> end element : addr:state(http://test.org/address) >>> characters(4): \n\t\t\t
　　　　　　>>> start element : addr:city(http://test.org/address) >>> characters(8): ShangHai
　　　　　　>>> end element : addr:city(http://test.org/address) >>> characters(3): \n\t\t
　　　　>>> end element : addr:address(http://test.org/address)
　　　　>>> end prefix_mapping : addr >>> characters(2): \n\t
　　>>> end element : bk:book(http://test.org/books) >>> characters(1): \n
>>> end element : bk:books(http://test.org/books)
>>> end prefix_mapping : bk>>> end document

SAX解析xml (遍历DOM树各节点)的更多相关文章

Dom,pull,Sax解析XML
本篇随笔将详细讲解如何在Android当中解析服务器端传过来的XML数据,这里将会介绍解析xml数据格式的三种方式,分别是DOM.SAX以及PULL. 一.DOM解析XML 我们首先来看看DOM(Do ...
DOM&SAX解析XML
在上一篇随笔中分析了xml以及它的两种验证方式.我们有了xml,但是里面的内容要怎么才能得到呢?如果得不到的话,那么还是没用的,解析xml的方式主要有DOM跟SAX,其中DOM是W3C官方的解析方式, ...
JAVA解析XML文件(DOM,SAX,JDOM,DOM4j附代码实现)
1.解析XML主要有四种方式 1.DOM方式解析XML(与平台无关,JAVA提供,一次性加载XML文件内容,形成树结构,不适用于大文件) 2.SAX方式解析XML(基于事件驱动,逐条解析,适用于只处理 ...
解析XML：DOM,SAX,PULL
Android解析XML有三种方式:DOM(document object model).SAX(simple api XML).PULL 1.DOM DOM解析XML文件时,会将XML文件的所有内容 ...
java解析XML之DOM解析和SAX解析（包含CDATA的问题）
Dom解析功能强大,可增删改查,操作时会将XML文档读到内存,因此适用于小文档: SAX解析是从头到尾逐行逐个元素解析,修改较为不便,但适用于只读的大文档:SAX采用事件驱动的方式解析XML.如同在电 ...
经典面试题：一张表区别DOM解析和SAX解析XML
============DOM解析 vs ...
JAVA使用SAX解析XML文件
在我的另一篇文章(http://www.cnblogs.com/anivia/p/5849712.html)中,通过一个例子介绍了使用DOM来解析XML文件,那么本篇文章通过相同的XML文件介绍如何使 ...
Java xml 操作(Dom4J修改xml + xPath技术 + SAX解析 + XML约束)
1 XML基础 1)XML的作用 1.1 作为软件配置文件 1.2 作为小型的"数据库" 2)XML语法(由w3c组织规定的) 标签: 标签名不能以数字开头,中间不能有空格,区分大 ...
JAVA解析XML之DOM方式
JAVA解析XML之DOM方式准备工作创建DocumentBuilderFactory对象; 创建DocumentBuilder对象; 通过DocumentBuilder对象的parse方法 ...

随机推荐

从0开始学习 GitHub 系列之「02.加入 GitHub」
转载地址: http://blog.csdn.net/googdev/article/details/52787586 看完昨天的文章「从0开始学习 GitHub 系列之「初识 GitHub」」估计不 ...
C# 如何比较版本号大小
最近遇到了一个数据迁移的问题,因为配置文件的结构发生变化,所以要把低版本的用户数据保存下来,存到最新版本中去. 这里就有一个比较版本号大小的问题了,网上乱七八糟算法一堆,大致意思就是用分割字符串的方法 ...
【JZOJ5068】【GDSOI2017第二轮模拟】树动态规划+prufer序列
题面有n个点,它们从1到n进行标号,第i个点的限制为度数不能超过A[i]. 现在对于每个s (1 <= s <= n),问从这n个点中选出一些点组成大小为s的有标号无根树的方案数. 10 ...
python学习笔记10--协程、IO、IO多路复用
本节内容一.协程 1.1.协程概念 1.2.greenlet 1.3.Gevent 1.4.协程之爬虫 1.5.协程之socket 二.论事件驱动与异步IO 三.IO 3.1.概念说明 3.2.IO ...
JS函数式编程 - 概念
最近在看Typescript,顺便看了一些函数式编程,然后半个国庆假期就没有了.做个笔记,分几个部分写吧. 最开始接触函数式编程的时候,第一个接触的概念就是高阶函数,和柯里化.咋一看,这不就是长期用来 ...
jsp之jstl（展示所有商品、重写登录案例）
jsp之jstl jstl: jsp标准的标签库语言,apache的,是用来替代java脚本使用步骤: 1.导入jar包 (jstl.jar和standard.jar) 2.在页面上导入标签库 &l ...
Leetcode872.Leaf-Similar Trees叶子相似的树
请考虑一颗二叉树上所有的叶子,这些叶子的值按从左到右的顺序排列形成一个叶值序列 . 举个例子,如上图所示,给定一颗叶值序列为 (6, 7, 4, 9, 8) 的树. 如果有两颗二叉树的叶值序列是相同 ...
利用Factory-boy和sqlalchemy来批量生成数据库表数据
测试过程中免不了要构造测试数据,如果是单条数据,还比较简单,但如果是批量数据,就比较麻烦了. 最近看到Factory_boy这个python第三方库,它通过SQLAlchemyModelFactory ...
洛谷 P2146 [NOI2015]软件包管理器树链剖分
目录题面题目链接题目描述输入输出格式输入格式: 输出格式: 输入输出样例输入样例#1: 输出样例#1: 输入样例#2: 输出样例#2: 说明说明思路 AC代码总结题面题目链接 P ...
Leetcode811.Subdomain Visit Count子域名访问计数
一个网站域名,如"discuss.leetcode.com",包含了多个子域名.作为顶级域名,常用的有"com",下一级则有"leetcode.com ...

SAX解析xml (遍历DOM树各节点)

SAX解析xml (遍历DOM树各节点)的更多相关文章

随机推荐

热门专题