笔记：XML-解析文档-DOM

要处理XML文档，就要先解析（parse）他，解析器时这样一个程序，读入一个文件，确认整个文件具有正确的格式，然后将其分解成各种元素，使得程序员能够访问这些元素，Java库提供了两种XML解析器：

像文档对象模型（Document Object Model，DOM）解析器这样的树型解析器，他们将读入的XML文档转换成树结构
像XML简单API（Simple API for XML，SAX）解析器这样的流机制解析器，他们读入XML文档时生成相应的事件

DOM解析器对于实现我们的大多数目的来说都更容易一些，如果需要处理很长的文档，用他来生成树结构会消耗大量的内存，或者只需要对于某些元素感兴趣，而不关心他们的上下文，那么可以考虑使用SAX解析器。DOM解析器的接口已经被W3C标准化了，org.w3c.dom包中包含了这些接口类型的定义，比如：Document、Element等，不同的实现者都编写了实现这些接口的DOM解析器，Java
XML
处理API（Java
API
for
XML
Processing，JAXP）库使得实际上可以以插件形式使用这些解析器中的任意一个。要读入一个XML文档，首先需要一个DocumentBuilder对象，可以从
DocumentBuilderFactory
中得到这个对象，代码如下：

DocumentBuilderFactory factory=DocumentBuilderFactory.newInstance();

DocumentBuilder builder=factory.newDocumentBuilder();

现在，可以从文件中读入某个文档：

File f = …;

Document doc = builder.parse(f);

或者，可以用一个URL：

URL u = …;

Document doc = builder.parse(u);

甚至可以使用一个任意的输入流：

InputStream in = …;

Document doc = builder.parse(in);

Document 对象时XML文档的树型结构在内存的表现，他由实现了 Node 接口及其各子接口的类对象构成，子接口层次结构如下：

DOM
解析XML文档的代码示例如下：

XML文档内容：

<?xml version="1.0" encoding="utf-8" ?>

<root>

        <title>

                <font enabled="false">

                        

                        <name>Helvetica</name>

                        <size>36</size>

                </font>

                <data>

                        <![CDATA[xml document root node <root.../>]]>

                </data>

        </title>

</root>
解析代码：

public static
void
main(String[] args) {

                DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance();

                try {

                        DocumentBuilder builder = factory.newDocumentBuilder();

                        Path xmlPath = Paths.get("E:\\IDEA Workspace\\exampleiostream\\src\\main\\java\\org\\drsoft\\examples\\xml", "appParse.xml");

                        InputStream xmlStream = Files.newInputStream(xmlPath, StandardOpenOption.READ);

                        Document xmlDocument = builder.parse(xmlStream);

                        StringBuilder sb = new
StringBuilder();

                        sb.append("<?xml version=\"" + xmlDocument.getXmlVersion() + "\"
encodin=\""

+ xmlDocument.getXmlEncoding() + "\"
?>");

                        Element root = xmlDocument.getDocumentElement();

                        sb.append("<" + root.getTagName() + ">");

                        NodeList nodeList = root.getChildNodes();

                        for (int i = 0; i < nodeList.getLength(); i++) {

                                if (nodeList.item(i) instanceof Element) {

                                        sb.append(parseChildNodes((Element) nodeList.item(i)));

                                }

                        }

                        sb.append("</" + root.getTagName() + ">");

                        System.out.println(sb.toString());

                } catch (ParserConfigurationException e) {

                        e.printStackTrace();

                } catch (IOException ex) {

                        ex.printStackTrace();

                } catch (SAXException e) {

                        e.printStackTrace();

                }

        }

        private static String parseChildNodes(Element element) {

                StringBuilder sb = new
StringBuilder();

                sb.append("<" + element.getTagName());

                NamedNodeMap map = element.getAttributes();

                for (int j = 0; j < map.getLength(); j++) {

                        sb.append(" " + map.item(j).getNodeName() + "=\"" + map.item(j).getNodeValue() + "\"");

                }

                sb.append(" >");

                if (element.hasChildNodes()) {

                        NodeList list = element.getChildNodes();

                        for (int i = 0; i < list.getLength(); i++) {

                                if (list.item(i) instanceof Element) {

                                        Element curElement = (Element) list.item(i);

                                        sb.append(parseChildNodes(curElement));

                                        continue;

                                }

                                if (list.item(i) instanceof CDATASection) {

                                        CDATASection cdataSection = (CDATASection) list.item(i);

                                        sb.append("<![CDATA[").append(cdataSection.getData()).append("]]>");

                                        continue;

                                }

                                if (list.item(i) instanceof Comment) {

                                        Comment comment = (Comment)list.item(i);

                                        sb.append("");

                                        continue;

                                }

                                if (list.item(i) instanceof Text) {

                                        Text curText = (Text) list.item(i);

                                        sb.append(curText.getData().trim());

                                        continue;

                                }

                        }

                }

                sb.append("</" + element.getTagName() + ">");

                return sb.toString();

        }

笔记：XML-解析文档-DOM的更多相关文章

XML之DOM解析文档 Day24
TestDom.java package com.sxt.dom; import java.io.File; import java.io.IOException; import javax.xml. ...
JavaEE实战——XML文档DOM、SAX、STAX解析方式详解
原 JavaEE实战--XML文档DOM.SAX.STAX解析方式详解 2016年06月22日 23:10:35 李春春_ 阅读数:3445 标签: DOMSAXSTAXJAXPXML Pull 更多 ...
5月3日上课笔记-XML解析
一.XML编程 1.xml编程的两种解析方式 1.1 dom解析优点:一次加载,多次使用.可以方便的对xml文档进行增删改查缺点:如果xml文档过大的话,加载的时候会比较占用内存空间比较大,消耗资 ...
XML的文档声明
1.XML的文档声明 <?xml version="1.0" encoding="utf-8"?> 文档声明必须写在第一行第一列属性: versi ...
文档ID：某某模板文件不存在，无法解析文档！
如果是生成栏目列表时出现这样的问题]: 1.可以修改include/arc.listview.class.php这个文件. 2.复制代码 echo "模板文件不存在,无法解析文档 ...
DedeCMS模板文件不存在,无法解析文档! 问题定位方法
生成静态的时候,经常会遇到“模板文件不存在,无法解析文档!”的问题.很多朋友试过论坛里很多方法,都是针对某些人可以解决,某些人的问题依旧,为什么呢?其实问题很可能确实是多种多样的,表现结果却是一样, ...
dedecms 模板文件不存在，无法解析文档"的终极各种解决办法
方法一:[此对应喜欢把模板文件使用".html"的格式,] /include/arc.archives.class.php 556行 if (!preg_match(&qu ...
dedecms 模板文件不存在无法解析文档！问题定位方法！
生成静态的时候,经常会遇到“模板文件不存在,无法解析文档!”的问题.很多朋友试过论坛里很多方法,都是针对某些人可以解决,某些人的问题依旧,为什么呢?其实问题很可能确实是多种多样的,表现结果却是一样, ...
dedecms 模板文件不存在,无法解析文档的终极各种解决办法
dedecms 模板文件不存在,无法解析文档"的终极各种解决办法方法一:[此对应喜欢把模板文件使用".html"的格式,] /include/arc.archives. ...
java解析xml文档(dom)
DOM解析XML文档读取本地的xml文件,通过DOM进行解析,DOM解析的特点就是把整个xml文件装载入内存中,形成一颗DOM树形结构,树结构是方便遍历和和操纵. DOM解析的特性就是读取xml文件 ...

随机推荐

Array.reduce()学习
昨天遇到的一道题:1234567890 => 1,234,567,890 要求其实就是使用逗号做千分位将数字进行分隔. 当时没想到任何方法,但是以前看到过,印象很深刻,今天就找了一下. 看到其实 ...
ubuntu自动登录tty1(shell,text)配置
1.写脚本autologin 代码: #!/bin/bash/bin/login -f #你的用户名移动到/usr/bin/下,并且用chmod +x autologin设置可执行权限 2.修改/e ...
FusionCharts封装-dataset和categories
Chart.java: /** * @Title:Chart.java * @Package:com.fusionchart.model * @Description:FusionCharts 封装d ...
【linux】 LINUX FTP搭建
1.安装ftp服务 yum install vsftpd 2.编辑配置文件 vsftpd的配置文件有三个,分别是:/etc/vsftpd/vsftpd.conf/etc/vsftpd/ftpusers ...
错误代码： 1247 Reference 'startTime' not supported (forward reference in item list)
1.错误描述 1 queries executed, 0 success, 1 errors, 0 warnings 查询:SELECT a.createUserId AS typeId, (SELE ...
No bean named 'sessionFactory' is defined
1.错误描述严重:Servlet service() for servlet default threw exception . org.springframework.beans.factory. ...
DirectShow学习笔记总结
DirectShow是微软公司在ActiveMovie和Video for Windows的基础上推出的新一代基于COM(Component Object Model)的流媒体处理的开发包,9.0之前 ...
Django学习-13-simple_tag使用
一些HTML方法 {{item.event_start | date:"Y-m-d H:i:s"}} {{bi ...
SPOJ D-QUERY
以前主席树学 kungbin 最近看了网上的版本终于发现和我以前学的线段树差不多的了希望最近能够加强 #include<bits/stdc++.h> using namespace ...
Inception模型和Residual模型卷积操作的keras实现
Inception模型和Residual残差模型是卷积神经网络中对卷积升级的两个操作. 一. Inception模型(by google) 这个模型的trick是将大卷积核变成小卷积核,将多个卷积核 ...

笔记：XML-解析文档-DOM

笔记：XML-解析文档-DOM的更多相关文章

随机推荐

热门专题