笔记：XML-解析文档-流机制解析器（SAX、StAX）

DOM
解析器完整的读入XML文档，然后将其转换成一个树型的数据结构，对于大多数应用，DOM 都运行很好，但是，如果文档很大，并且处理算法又非常简单，可以在运行时解析节点，而不必看到完整的树形结构，那么我们应该使用流机制解析器（streaming parser），Java 类库提供的流解析机制有 SAX 解析器和 StAX 解析器，SAX 解析器是基于事件回调机制，而 StAX解析器提供了解析事件的迭代器。

使用SAX解析器

SAX
解析器在解析XML 输入的组成部分时会报告事件，在使用 SAX 解析器时，需要一个处理器来为不同的解析器事件定义事件动作，ContentHandler 接口定义了若干个在解析文档时解析器会调用的回调方法，我们可以使用
DefaultHandler
类，该类继承与
ContentHandler
并提供了默认实现，重要的方法如下：

startDocument：在文档开始时调用一次
endDocument：在文档结束时调用一次
startElement：在遇到起始标签时调用，有3个描述元素名的参数，其中qName参数标识标签限定名，如果命名空间处理特性打开，则
uri
表示的是命名空间，localName 表示的是本地名。
endElement：在遇到结束标签时调用，其参数和
startElement
一致
characters：在每当遇到字符数据时调用，如果标签没有内容，但有子标签时，其中的空格会作为字符数据返回

示例代码如下：

事件处理类

public class CustomDefaultHandler extends DefaultHandler {

        @Override

        public
void
startDocument() throws SAXException {

                super.startDocument();

                System.out.println("call startDocument");

        }

        @Override

        public
void
endDocument() throws SAXException {

                super.endDocument();

                System.out.println("call endDocument");

        }

        @Override

        public
void
characters(char[] ch, int start, int length) throws SAXException {

                super.characters(ch, start, length);

                String chs = new
String(ch, start, length);

                System.out.println("characters ch=" + chs + " start=" + start + " length=" + length);

        }

        @Override

        public
void
startElement(String uri, String localName, String qName, Attributes attributes) throws SAXException {

                super.startElement(uri, localName, qName, attributes);

                StringBuilder sb = new
StringBuilder();

                for (int i = 0; i < attributes.getLength(); i++) {

                        sb.append(attributes.getLocalName(i) + "=\"" + attributes.getValue(i) + "\"
");

                }

                System.out.println("startElement qName=" + qName + " Uri=" + uri + " localName=" + localName + " "

+ sb.toString());

        }

        @Override

        public
void
endElement(String uri, String localName, String qName) throws SAXException {

                super.endElement(uri, localName, qName);

                System.out.println("endElement " + qName);

        }

}
调用类

try {

        Path xmlPath = Paths.get("E:\\IDEA Workspace\\exampleiostream\\src\\main\\java\\org\\drsoft\\examples\\xml", "appParse.xml");

        InputStream xmlStream = Files.newInputStream(xmlPath, StandardOpenOption.READ);

        SAXParserFactory saxParserFactory = SAXParserFactory.newInstance();

        SAXParser saxParser = saxParserFactory.newSAXParser();

        saxParser.parse(xmlStream, new
CustomDefaultHandler());

} catch (SAXException e) {

          e.printStackTrace();

} catch (ParserConfigurationException e) {

          e.printStackTrace();

} catch (IOException e) {

          e.printStackTrace();

}

使用StAX解析器

StAX
解析器时一种拉解析器（pull
parser），与安装事件处理器不同，只需要使用基本的循环来迭代所有事件，示例代码如下：

try {

      Path xmlPath = Paths.get("E:\\IDEA Workspace\\exampleiostream\\src\\main\\java\\org\\drsoft\\examples\\xml", "appParse.xml");

      InputStream xmlStream = Files.newInputStream(xmlPath, StandardOpenOption.READ);

      XMLInputFactory factory = XMLInputFactory.newFactory();

      XMLStreamReader parser = factory.createXMLStreamReader(xmlStream);

      while (parser.hasNext()) {

                  int event = parser.next();

                  switch (event) {

                          case XMLStreamConstants.START_DOCUMENT:

                                    System.out.println("START_DOCUMENT Call");

                                    break;

                          case XMLStreamConstants.END_DOCUMENT:

                                    System.out.println("END_DOCUMENT Call");

                                    break;

                          case XMLStreamConstants.START_ELEMENT:

                                    StringBuilder sb = new
StringBuilder();

                                    for (int i = 0; i < parser.getAttributeCount(); i++) {

                                            sb.append(parser.getAttributeName(i) + "=\"" + parser.getAttributeValue(i) + "\"
");

                                    }

                                    System.out.println("START_ELEMENT qName=" + parser.getName() + " Uri="

+ parser.getNamespaceURI() + " localName=" + parser.getLocalName() + " attribute="

+ sb.toString());

                                    break;

                          case XMLStreamConstants.END_ELEMENT:

                                    System.out.println("END_ELEMENT qName=" + parser.getName() + " Uri=" + parser.getNamespaceURI()

                                                     + " localName=" + parser.getLocalName());

                                    break;

                          case XMLStreamConstants.CHARACTERS:

                                    int start = parser.getTextStart();

                                    int length = parser.getTextLength();

                                    System.out.println("CHARACTERS text=" + new
String(parser.getTextCharacters(), start, length));

                                    break;

                }

      }

} catch (IOException e) {

        e.printStackTrace();

} catch (XMLStreamException e) {

      e.printStackTrace();

}

笔记：XML-解析文档-流机制解析器（SAX、StAX）的更多相关文章

前端学习笔记之CSS文档流
先引用一段W3C的文档: 9.3 Positioning schemes In CSS 2.1, a box may be laid out according to three positionin ...
源生API解析XML文档与dom4j解析XML文档
一.XML语言 XML是一种可扩展的标记语言,是一种强类型的语言,类似HTML(超文本标记语言,是一种弱类型的语言).XML是一种通用的数据交换格式(关系型数据库),综上所诉:XML可以传输数据,也可 ...
[Swift通天遁地]七、数据与安全-(2)对XML和HTML文档的快速解析
★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★➤微信公众号:山青咏芝(shanqingyongzhi)➤博客园地址:山青咏芝(https://www.cnblogs. ...
2.1 使用JAXP 对 xml文档进行DOM解析
//使用 jaxp 对xml文档进行dom解析 public class Demo2 { //必要步骤 @Test public void test() throws Exception { //1. ...
XML之DOM解析文档 Day24
TestDom.java package com.sxt.dom; import java.io.File; import java.io.IOException; import javax.xml. ...
文档ID：某某模板文件不存在，无法解析文档！
如果是生成栏目列表时出现这样的问题]: 1.可以修改include/arc.listview.class.php这个文件. 2.复制代码 echo "模板文件不存在,无法解析文档 ...
DedeCMS模板文件不存在,无法解析文档! 问题定位方法
生成静态的时候,经常会遇到“模板文件不存在,无法解析文档!”的问题.很多朋友试过论坛里很多方法,都是针对某些人可以解决,某些人的问题依旧,为什么呢?其实问题很可能确实是多种多样的,表现结果却是一样, ...
dedecms 模板文件不存在，无法解析文档"的终极各种解决办法
方法一:[此对应喜欢把模板文件使用".html"的格式,] /include/arc.archives.class.php 556行 if (!preg_match(&qu ...
dedecms 模板文件不存在无法解析文档！问题定位方法！
生成静态的时候,经常会遇到“模板文件不存在,无法解析文档!”的问题.很多朋友试过论坛里很多方法,都是针对某些人可以解决,某些人的问题依旧,为什么呢?其实问题很可能确实是多种多样的,表现结果却是一样, ...

随机推荐

linux dns搭建
DNS:域名解析(Domain Nmae System)正向解析:根据主机名称(域名)查找其对应的ip地址,这是最基本,最常用的功能反向解析:根据ip地址查找其对应的主机名称(域名),反垃圾邮件/安全 ...
使用BEM命名规范来组织CSS代码
BEM 是 Block(块) Element(元素) Modifier(修饰器)的简称使用BEM规范来命名CSS,组织HTML中选择器的结构,利于CSS代码的维护,使得代码结构更清晰(弊端主要是名字 ...
【mysql】mysql密码设置和更改
密码设置: 当用户没有设置密码时: 添加密码: mysqladmin -uroot -password ab12 注:因为开始时root没有密码,所以-p旧密码一项就可以省略了. 当用户存在密码时: ...
【mongodb系统学习之十】mongodb查询（三）
6).特殊类型的查询: A).查询键为null的文档:查询时,如果按常规的key:null的方式做条件,不仅会匹配到值为null的,还会匹配到不存在这个键的:如果只是要值为null的文档,就必须使用 ...
JavaScript向select下拉框中添加和删除元素
JavaScript向select下拉框中添加和删除元素 1.说明 a 利用append()方法向下拉框中添加元素 b 利用remove()方法移除下拉框中最后一个元素 2.设计源码 < ...
do while 循环和while循环的区别
do while 循环和while循环的区别 1.do while循环是先执行循环体,然后判断循环条件,如果为真,则执行下一步循环,否则终止循环: while循环是先判断循环条件,如果条件为真则 ...
使用dos的tree命令输出文件夹树
用dos的tree命令就可以实现文件夹树状图的输出,不过目前仅能输出为.txt文件方法如下: 开始->运行输入cmd打开命令控制台切换到你要显示的列表文件夹比如输入 d: 切换到d盘 ...
Text Document Analysis CodeForces - 723B
Modern text editors usually show some information regarding the document being edited. For example, ...
javaScript替换元素节点
<!DOCTYPE HTML> <html> <head> <meta http-equiv="Content-Type" content ...
元素（WebElement）-----Selenium快速入门（三）
上一篇<元素定位-----Selenium快速入门(二)>说了,如何定位元素,本篇说说找到的元素(WebElement)该怎么用. WebElement常用方法: 返回值方法名说 ...

笔记：XML-解析文档-流机制解析器（SAX、StAX）

笔记：XML-解析文档-流机制解析器（SAX、StAX）的更多相关文章

随机推荐

热门专题