DOM
解析器完整的读入XML文档,然后将其转换成一个树型的数据结构,对于大多数应用,DOM 都运行很好,但是,如果文档很大,并且处理算法又非常简单,可以在运行时解析节点,而不必看到完整的树形结构,那么我们应该使用流机制解析器(streaming parser),Java 类库提供的流解析机制有 SAX 解析器和 StAX 解析器,SAX 解析器是基于事件回调机制,而 StAX解析器提供了解析事件的迭代器。

  1. 使用SAX解析器

    SAX
    解析器在解析XML 输入的组成部分时会报告事件,在使用 SAX 解析器时,需要一个处理器来为不同的解析器事件定义事件动作,ContentHandler 接口定义了若干个在解析文档时解析器会调用的回调方法,我们可以使用
    DefaultHandler
    类,该类继承与
    ContentHandler
    并提供了默认实现,重要的方法如下:

  • startDocument:在文档开始时调用一次
  • endDocument:在文档结束时调用一次
  • startElement:在遇到起始标签时调用,有3个描述元素名的参数,其中qName参数标识标签限定名,如果命名空间处理特性打开,则
    uri
    表示的是命名空间,localName 表示的是本地名。
  • endElement:在遇到结束标签时调用,其参数和
    startElement
    一致
  • characters:在每当遇到字符数据时调用,如果标签没有内容,但有子标签时,其中的空格会作为字符数据返回

示例代码如下:

  • 事件处理类

    public class CustomDefaultHandler extends DefaultHandler {

            @Override

            public
    void
    startDocument() throws SAXException {

                    super.startDocument();

     
     

                    System.out.println("call startDocument");

            }

     
     

            @Override

            public
    void
    endDocument() throws SAXException {

                    super.endDocument();

                    System.out.println("call endDocument");

            }

     
     

            @Override

            public
    void
    characters(char[] ch, int start, int length) throws SAXException {

                    super.characters(ch, start, length);

     
     

                    String chs = new
    String(ch, start, length);

                    System.out.println("characters ch=" + chs + " start=" + start + " length=" + length);

            }

     
     

            @Override

            public
    void
    startElement(String uri, String localName, String qName, Attributes attributes) throws SAXException {

                    super.startElement(uri, localName, qName, attributes);

     
     

                    StringBuilder sb = new
    StringBuilder();

                    for (int i = 0; i < attributes.getLength(); i++) {

                            sb.append(attributes.getLocalName(i) + "=\"" + attributes.getValue(i) + "\"
    ");

                    }

     
     

                    System.out.println("startElement qName=" + qName + " Uri=" + uri + " localName=" + localName + " "

    + sb.toString());

            }

     
     

            @Override

            public
    void
    endElement(String uri, String localName, String qName) throws SAXException {

                    super.endElement(uri, localName, qName);

     
     

                    System.out.println("endElement " + qName);

            }

    }

  • 调用类

    try {

            Path xmlPath = Paths.get("E:\\IDEA Workspace\\exampleiostream\\src\\main\\java\\org\\drsoft\\examples\\xml", "appParse.xml");

            InputStream xmlStream = Files.newInputStream(xmlPath, StandardOpenOption.READ);

            SAXParserFactory saxParserFactory = SAXParserFactory.newInstance();

            SAXParser saxParser = saxParserFactory.newSAXParser();

            saxParser.parse(xmlStream, new
    CustomDefaultHandler());

    } catch (SAXException e) {

              e.printStackTrace();

    } catch (ParserConfigurationException e) {

              e.printStackTrace();

    } catch (IOException e) {

              e.printStackTrace();

    }

  1. 使用StAX解析器

    StAX
    解析器时一种拉解析器(pull
    parser),与安装事件处理器不同,只需要使用基本的循环来迭代所有事件,示例代码如下:

    try {

          Path xmlPath = Paths.get("E:\\IDEA Workspace\\exampleiostream\\src\\main\\java\\org\\drsoft\\examples\\xml", "appParse.xml");

          InputStream xmlStream = Files.newInputStream(xmlPath, StandardOpenOption.READ);

     
     

          XMLInputFactory factory = XMLInputFactory.newFactory();

          XMLStreamReader parser = factory.createXMLStreamReader(xmlStream);

     
     

          while (parser.hasNext()) {

                      int event = parser.next();

                      switch (event) {

                              case XMLStreamConstants.START_DOCUMENT:

                                        System.out.println("START_DOCUMENT Call");

                                        break;

     
     

                              case XMLStreamConstants.END_DOCUMENT:

                                        System.out.println("END_DOCUMENT Call");

                                        break;

     
     

                              case XMLStreamConstants.START_ELEMENT:

                                        StringBuilder sb = new
    StringBuilder();

                                        for (int i = 0; i < parser.getAttributeCount(); i++) {

                                                sb.append(parser.getAttributeName(i) + "=\"" + parser.getAttributeValue(i) + "\"
    ");

                                        }

                                        System.out.println("START_ELEMENT qName=" + parser.getName() + " Uri="

    + parser.getNamespaceURI() + " localName=" + parser.getLocalName() + " attribute="

    + sb.toString());

                                        break;

     
     

                              case XMLStreamConstants.END_ELEMENT:

                                        System.out.println("END_ELEMENT qName=" + parser.getName() + " Uri=" + parser.getNamespaceURI()

                                                         + " localName=" + parser.getLocalName());

                                        break;

     
     

                              case XMLStreamConstants.CHARACTERS:

                                        int start = parser.getTextStart();

                                        int length = parser.getTextLength();

                                        System.out.println("CHARACTERS text=" + new
    String(parser.getTextCharacters(), start, length));

                                        break;

                    }

          }

    } catch (IOException e) {

            e.printStackTrace();

    } catch (XMLStreamException e) {

          e.printStackTrace();

    }

     
     

     
     

笔记:XML-解析文档-流机制解析器(SAX、StAX)的更多相关文章

  1. 前端学习笔记之CSS文档流

    先引用一段W3C的文档: 9.3 Positioning schemes In CSS 2.1, a box may be laid out according to three positionin ...

  2. 源生API解析XML文档与dom4j解析XML文档

    一.XML语言 XML是一种可扩展的标记语言,是一种强类型的语言,类似HTML(超文本标记语言,是一种弱类型的语言).XML是一种通用的数据交换格式(关系型数据库),综上所诉:XML可以传输数据,也可 ...

  3. [Swift通天遁地]七、数据与安全-(2)对XML和HTML文档的快速解析

    ★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★➤微信公众号:山青咏芝(shanqingyongzhi)➤博客园地址:山青咏芝(https://www.cnblogs. ...

  4. 2.1 使用JAXP 对 xml文档进行DOM解析

    //使用 jaxp 对xml文档进行dom解析 public class Demo2 { //必要步骤 @Test public void test() throws Exception { //1. ...

  5. XML之DOM解析文档 Day24

    TestDom.java package com.sxt.dom; import java.io.File; import java.io.IOException; import javax.xml. ...

  6. 文档ID:某某 模板文件不存在,无法解析文档!

    如果是生成栏目列表时出现这样的问题]:   1.可以修改include/arc.listview.class.php这个文件. 2.复制代码     echo "模板文件不存在,无法解析文档 ...

  7. DedeCMS模板文件不存在,无法解析文档! 问题定位方法

    生成静态的时候,经常会遇到“模板文件不存在,无法解析文 档!”的问题.很多朋友试过论坛里很多方法,都是针对某些人可以解决,某些人的问题依旧,为什么呢?其实问题很可能确实是多种多样的,表现结果却是一样, ...

  8. dedecms 模板文件不存在,无法解析文档"的终极各种解决办法

    方法一:[此对应喜欢把模板文件使用".html"的格式,]  /include/arc.archives.class.php 556行    if (!preg_match(&qu ...

  9. dedecms 模板文件不存在 无法解析文档!问题定位方法!

    生成静态的时候,经常会遇到“模板文件不存在,无法解析文 档!”的问题.很多朋友试过论坛里很多方法,都是针对某些人可以解决,某些人的问题依旧,为什么呢?其实问题很可能确实是多种多样的,表现结果却是一样, ...

随机推荐

  1. mysql主键,外键,索引

    主键 唯一而非空,只能有一个 作用: 1.唯一的标识一行  2.作为一个可以被外键有效引用的对象  3.保证数据完整性 设计原则: 1. 主键应当是对用户没有意义的.如果用户看到了一个表示多对多关系的 ...

  2. Visual Studio Code搭建python开发环境

    开发Python的环境有很多,原来已经在vs2013上面搭建好python的开发环境了,但是vs2013每次启动都占太多内存(太强大了吧),这下出了vs code,既轻量又酷炫,正好拿来试一试开发py ...

  3. 约瑟夫环-循环队列算法(曾微软,google笔试题)

    这也是我们聚会时常常做的游戏之一. 算法思路: 此处我使用循环链表模拟人围城一圈,每一个结点代表一个人.链表是一个有序链表,链表结点数据域是一个整型,代表人的序号.出局等同于链表删除元素,每次出局后重 ...

  4. caffe︱深度学习参数调优杂记+caffe训练时的问题+dropout/batch Normalization

    一.深度学习中常用的调节参数 本节为笔者上课笔记(CDA深度学习实战课程第一期) 1.学习率 步长的选择:你走的距离长短,越短当然不会错过,但是耗时间.步长的选择比较麻烦.步长越小,越容易得到局部最优 ...

  5. HeapAlloc,GlobalAlloc,LocalAlloc,VirtualAlloc,malloc,new的异同

    1. 首先我们来看HeapAlloc: MSDN上的解释为:HeapALloc是从堆上分配一块内存,且分配的内存是不可移动的(即如果没有连续的空间能满足分配的大小,程序不能将其他零散的 空间利用起来, ...

  6. FusionWidgets之AngularGauge图

    1.设置AngularGauge图的数据源 AngularGauge.xml: <?xml version="1.0" encoding="UTF-8"? ...

  7. freemarker写select组件报错总结(一)

    1.具体错误如下 六月 25, 2014 11:26:29 下午 freemarker.log.JDK14LoggerFactory$JDK14Logger error 严重: Template pr ...

  8. 序列化Json格式

    Json = JsonUtil.Serialize(new { code = 1, msg = "文件删除成功" }); public class JsonUtil     {   ...

  9. OpenCV实现图像上添加汉字 转

    <span style="font-size:18px;">void GetStringSize(HDC hDC, const char* str, int* w, i ...

  10. CASE WHEN用法

    问题:假如说这个条件有一条数据不满足,那么那条数据就不会读出来,,那么,我怎么才能把它读出并且赋值为空呢 方法: SELECT `s`.*, ( CASE THEN SUM(a.total_numbe ...