要处理XML文档,就要先解析(parse)他,解析器时这样一个程序,读入一个文件,确认整个文件具有正确的格式,然后将其分解成各种元素,使得程序员能够访问这些元素,Java库提供了两种XML解析器:

  • 像文档对象模型(Document Object Model,DOM)解析器这样的树型解析器,他们将读入的XML文档转换成树结构
  • 像XML简单API(Simple API for XML,SAX)解析器这样的流机制解析器,他们读入XML文档时生成相应的事件

DOM解析器对于实现我们的大多数目的来说都更容易一些,如果需要处理很长的文档,用他来生成树结构会消耗大量的内存,或者只需要对于某些元素感兴趣,而不关心他们的上下文,那么可以考虑使用SAX解析器。DOM解析器的接口已经被W3C标准化了,org.w3c.dom包中包含了这些接口类型的定义,比如:Document、Element等,不同的实现者都编写了实现这些接口的DOM解析器,Java
XML
处理API(Java
API
for
XML
Processing,JAXP)库使得实际上可以以插件形式使用这些解析器中的任意一个。要读入一个XML文档,首先需要一个DocumentBuilder对象,可以从
DocumentBuilderFactory
中得到这个对象,代码如下:

DocumentBuilderFactory factory=DocumentBuilderFactory.newInstance();

DocumentBuilder builder=factory.newDocumentBuilder();

现在,可以从文件中读入某个文档:

 File f = …;

Document doc = builder.parse(f);

或者,可以用一个URL:

URL u = …;

Document doc = builder.parse(u);

甚至可以使用一个任意的输入流:

InputStream in = …;

Document doc = builder.parse(in);

Document 对象时XML文档的树型结构在内存的表现,他由实现了 Node 接口及其各子接口的类对象构成,子接口层次结构如下:

DOM
解析XML文档的代码示例如下:

  • XML文档内容:

    <?xml version="1.0" encoding="utf-8" ?>

    <root>

            <title>

                    <font enabled="false">

                            <!-- 字体名称 -->

                            <name>Helvetica</name>

                            <size>36</size>

                    </font>

                    <data>

                            <![CDATA[xml document root node <root.../>]]>

                    </data>

            </title>

    </root>

  • 解析代码:

    public static
    void
    main(String[] args) {

                    DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance();

                    try {

                            DocumentBuilder builder = factory.newDocumentBuilder();

                            Path xmlPath = Paths.get("E:\\IDEA Workspace\\exampleiostream\\src\\main\\java\\org\\drsoft\\examples\\xml", "appParse.xml");

                            InputStream xmlStream = Files.newInputStream(xmlPath, StandardOpenOption.READ);

                            Document xmlDocument = builder.parse(xmlStream);

                            StringBuilder sb = new
    StringBuilder();

                            sb.append("<?xml version=\"" + xmlDocument.getXmlVersion() + "\"
    encodin=\""

    + xmlDocument.getXmlEncoding() + "\"
    ?>");

                            Element root = xmlDocument.getDocumentElement();

                            sb.append("<" + root.getTagName() + ">");

                            NodeList nodeList = root.getChildNodes();

                            for (int i = 0; i < nodeList.getLength(); i++) {

                                    if (nodeList.item(i) instanceof Element) {

                                            sb.append(parseChildNodes((Element) nodeList.item(i)));

                                    }

                            }

                            sb.append("</" + root.getTagName() + ">");

                            System.out.println(sb.toString());

                    } catch (ParserConfigurationException e) {

                            e.printStackTrace();

                    } catch (IOException ex) {

                            ex.printStackTrace();

                    } catch (SAXException e) {

                            e.printStackTrace();

                    }

            }

     
     

            private static String parseChildNodes(Element element) {

                    StringBuilder sb = new
    StringBuilder();

                    sb.append("<" + element.getTagName());

                    NamedNodeMap map = element.getAttributes();

                    for (int j = 0; j < map.getLength(); j++) {

                            sb.append(" " + map.item(j).getNodeName() + "=\"" + map.item(j).getNodeValue() + "\"");

                    }

                    sb.append(" >");

                    if (element.hasChildNodes()) {

                            NodeList list = element.getChildNodes();

                            for (int i = 0; i < list.getLength(); i++) {

                                    if (list.item(i) instanceof Element) {

                                            Element curElement = (Element) list.item(i);

                                            sb.append(parseChildNodes(curElement));

                                            continue;

                                    }

                                    if (list.item(i) instanceof CDATASection) {

                                            CDATASection cdataSection = (CDATASection) list.item(i);

                                            sb.append("<![CDATA[").append(cdataSection.getData()).append("]]>");

                                            continue;

                                    }

                                    if (list.item(i) instanceof Comment) {

                                            Comment comment = (Comment)list.item(i);

                                            sb.append("<!-- "+comment.getData()+" -->");

                                            continue;

                                    }

                                    if (list.item(i) instanceof Text) {

                                            Text curText = (Text) list.item(i);

                                            sb.append(curText.getData().trim());

                                            continue;

                                    }

                            }

                    }

                    sb.append("</" + element.getTagName() + ">");

                    return sb.toString();

            }

     
     

笔记:XML-解析文档的更多相关文章

  1. XML之DOM解析文档 Day24

    TestDom.java package com.sxt.dom; import java.io.File; import java.io.IOException; import javax.xml. ...

  2. XML的文档声明

    1.XML的文档声明 <?xml version="1.0" encoding="utf-8"?> 文档声明必须写在第一行第一列 属性: versi ...

  3. 5月3日上课笔记-XML解析

    一.XML编程 1.xml编程的两种解析方式 1.1 dom解析 优点:一次加载,多次使用.可以方便的对xml文档进行增删改查 缺点:如果xml文档过大的话,加载的时候会比较占用内存空间比较大,消耗资 ...

  4. 文档ID:某某 模板文件不存在,无法解析文档!

    如果是生成栏目列表时出现这样的问题]:   1.可以修改include/arc.listview.class.php这个文件. 2.复制代码     echo "模板文件不存在,无法解析文档 ...

  5. DedeCMS模板文件不存在,无法解析文档! 问题定位方法

    生成静态的时候,经常会遇到“模板文件不存在,无法解析文 档!”的问题.很多朋友试过论坛里很多方法,都是针对某些人可以解决,某些人的问题依旧,为什么呢?其实问题很可能确实是多种多样的,表现结果却是一样, ...

  6. dedecms 模板文件不存在,无法解析文档"的终极各种解决办法

    方法一:[此对应喜欢把模板文件使用".html"的格式,]  /include/arc.archives.class.php 556行    if (!preg_match(&qu ...

  7. dedecms 模板文件不存在 无法解析文档!问题定位方法!

    生成静态的时候,经常会遇到“模板文件不存在,无法解析文 档!”的问题.很多朋友试过论坛里很多方法,都是针对某些人可以解决,某些人的问题依旧,为什么呢?其实问题很可能确实是多种多样的,表现结果却是一样, ...

  8. dedecms 模板文件不存在,无法解析文档的终极各种解决办法

    dedecms 模板文件不存在,无法解析文档"的终极各种解决办法 方法一:[此对应喜欢把模板文件使用".html"的格式,] /include/arc.archives. ...

  9. dom4j解析xml报"文档中根元素后面的标记格式必须正确"

    今天,在写个批量启动报盘机的自动化应用,为了简化起见,将配置信息存储在xml中,格式如下: <?xml version="1.0" encoding="UTF-8& ...

  10. JavaWeb学习笔记——XML解析

    DOM解析操作 只在跟节点<addresslist>下面建立一个子节点<name> <?xml version="1.0" encoding=&quo ...

随机推荐

  1. python 爬取糗事百科 gui小程序

    前言:有时候无聊看一些搞笑的段子,糗事百科还是个不错的网站,所以就想用Python来玩一下.也比较简单,就写出来分享一下.嘿嘿 环境:Python 2.7 + win7 现在开始,打开糗事百科网站,先 ...

  2. java异常处理、多态

    第一:GC是什么? 为什么要有GC?  第二:垃圾回收的优点和原理.并考虑2种回收机制.  第三:垃圾回收器的基本原理是什么?垃圾回收器可以马上回收内存吗?有什么办法主动通知虚拟机进行垃圾回收?  第 ...

  3. 转:彻底搞清referrer和origin

    在http协议中有这两个字段,之前一直隐隐约约的觉得是,一种标记请求来源的方法(的确是),但是更细致的对这两个字段的比较却没有一个清楚的认识. referrer 到底是referer还是referre ...

  4. sparklyr包:实现Spark与R的接口+sparklyr 0.5

    本文转载于雪晴数据网 相关内容: sparklyr包:实现Spark与R的接口,会用dplyr就能玩Spark Sparklyr与Docker的推荐系统实战 R语言︱H2o深度学习的一些R语言实践-- ...

  5. 制作U盘启动CDLinux

    用U盘启动CDLinux的好处就此不必多说了,直接上料: 下载必需文件: 1,CDLinuxU盘启动制作工具:CDLinuxU盘启动制作工具 2,CDlinux 0.9.7 集_奶瓶_打气筒_mini ...

  6. 图像处理------快速均值模糊(Box Blur)

    图像模糊的本质, 从数字信号处理的角度看,图像模糊就要压制高频信号保留低频信号, 压制高频的信号的一个可选择的方法就是卷积滤波.选择一个低频滤波器,对图像上的 每个像素实现低频滤波,这样整体效果就是一 ...

  7. form表单中的input有哪些类型

    form表单中的input有哪些类型 1.button <input type="button"/> 2.checkbox <input type="c ...

  8. require()的工作流程

    require()的工作流程 当require()里传递一个参数x时,会有以下情况: x是一个文件 x是一个路径 eg. 当x为/home/dk/project/app 依次搜索以下的node_mod ...

  9. iOS - CALayer 绘图层

    1.CALayer 绘图层 在 iOS 系统中,你能看得见摸得着的东西基本上都是 UIView,比如一个按钮.一个文本标签.一个文本输入框.一个图标等等,这些都是 UIView.其实 UIView 之 ...

  10. php composer的学习之路(一)

    composer的介绍请看这里  http://docs.phpcomposer.com/00-intro.html composer的安装过程我就不介绍了,windows系统下跟其他安装没区别,一直 ...