JavaWeb学习日记----XML的解析

XML的解析简介：

　　在学习JavaScript时，我们用的DOM来解析HEML文档，根据HTML的层级结构在内存中分配一个树形结构，把HTML的标签啊，属性啊和文本之类的都封装成对象。

　　比如：document对象，element对象，属性对象，文本对象，Node结点对象

我们通常有两种方式来解析XML：DOM和SAX

　　DOM解析方式：

　　　　其实跟HTML差不多的，也是根据XML的层级结构在内存中分配一个树形结构，把XML的标签，属性和文本都封装成对象。

　　　　缺点：如果文件过大的话，就和造成内存溢出。

　　　　优点：可以很方便实现增删改操作。

　　SAX解析方式：

　　　　采用事件驱动，从上到下，一行一行的解析，边读边解析。解析到某一个对象时，返回对象名称。

　　　　缺点：不能实现增删改操作

　　　　优点：不会内存溢出，可以方便实现查询操作。

解析器：

　　在解析XML时，需要解析器。针对DOM和SAX，不同的公司和组织向我们提供了不同的解析器。

　　SUN公司： jaxp

　　dom4j组织： dom4j

　　jdom组织： jdom

　　在实际开发中，dom4j用的最多

jaxp:

　　jaxp解析器在JDK的javax.xml.parsers包里面。针对dom和sax分别提供了解析器：

　　　　dom:　　DocumentBuilder:　　解析器类

　　　　　　　　DocumentBuilderFactory:　　解析器工厂类

　　　　sax:　　SAXParser:　　解析器类

　　　　　　　　SAXParserFactory:　　解析器工厂类

那么我们具体获得JAXP中的DOM解析器的方法如下：

　　调用DocumentBuilderFactory.newInstance()方法得到创建DOM解析器的工厂。

　　调用工厂对象的newDocumentBuilder()方法得到解析器对象。

　　调用解析器对象的parse()方法解析XML文档，该方法的参数为XML文档的URL或者封装了XML路径的文件对象。即：parse(String uri)　　parse(File f)

　　示例：

　　　　　// 创建解析器工厂

        DocumentBuilderFactory documentBuilderFactory = DocumentBuilderFactory.newInstance();

        // 获得解析器

        DocumentBuilder documentBuilder = documentBuilderFactory.newDocumentBuilder();

        // 解析目标XML文件

        Document document = documentBuilder.parse("src/OnePiece.xml");

通过上述步骤我们就能得到代表整个文档的Document对象，就可以利用DOM特性对整个XML文档进行操纵了。

　　Document接口中常用的方法：

 NodeList getElementsByTagName(String tagname)     按文档顺序返回包含在文档中且具有给定标记名称的所Element的 NodeList。

 Element createElement(String tagName)     　　　　 创建指定类型的元素。

 Text createTextNode(String data)     　　　　　　   创建给定指定字符串的 Text 节点。

　　Document的父接口Node中常用的方法：

Node appendChild(Node newChild)

          将节点 newChild 添加到此节点的子节点列表的末尾。

Node removeChild(Node oldChild)

          从子节点列表中移除 oldChild 所指示的子节点，并将其返回。

 Node getParentNode()

          此节点的父节点。

String getTextContent()

          此属性返回此节点及其后代的文本内容。

void setTextContent(String textContent)

          此属性返回此节点及其后代的文本内容。

　　在得到的NodeList集合中有下列方法可以实现遍历：

int getLength()

          列表中的节点数。

 Node item(int index)

          返回集合中的第 index 个项。

在对Document对象进行更新操作时，都是在内存中进行的。如果想要更直观地显示在XML文档中，需要进行回写操作。即：把Document对象又重新写入到XML文件中。

示例：

现有一个XML文档内容如下：

<?xml version="1.0" encoding="UTF-8" standalone="no"?>

<海贼王>

    <草帽海贼团>

        <船长>路飞</船长>

        <厨师>山治</厨师>

        <航海士>娜美</航海士>

        <船医>乔巴</船医>

        <音乐家>贝多芬</音乐家>

    </草帽海贼团>

    <草帽海贼团>

        <副船长>索隆</副船长>

        <考古学家>罗宾</考古学家>

        <狙击手>乌索普</狙击手>

        <船工>弗兰奇</船工>

    </草帽海贼团>

</海贼王>

需求：将第一个<草帽海贼团>下面的<音乐家>内容贝多芬改为布鲁克

代码如下：

package com.alex;

import javax.xml.parsers.DocumentBuilder;

import javax.xml.parsers.DocumentBuilderFactory;

import javax.xml.transform.Transformer;

import javax.xml.transform.TransformerFactory;

import javax.xml.transform.dom.DOMSource;

import javax.xml.transform.stream.StreamResult;

import org.w3c.dom.Document;

import org.w3c.dom.Node;

import org.w3c.dom.NodeList;

/*

 * 将第一个<草帽海贼团>下面的<音乐家>内容贝多芬改为布鲁克

 */

public class OnePieceTest3 {

    public static void main(String[] args) throws Exception {

        // 创建解析器

        DocumentBuilderFactory documentBuilderFactory = DocumentBuilderFactory.newInstance();

        DocumentBuilder documentBuilder = documentBuilderFactory.newDocumentBuilder();

        // 解析目标XML文件

        Document document = documentBuilder.parse("src/OnePiece.xml");

        // 获得目标元素集合

        NodeList list = document.getElementsByTagName("草帽海贼团");

        Node node = list.item(0);

        NodeList childNodes = node.getChildNodes();

        for (int j = 0; j < childNodes.getLength(); j++) {

            Node node2 = childNodes.item(j);

            String nodeName = node2.getNodeName();

            if (nodeName.equals("音乐家"))

                node2.setTextContent("布鲁克");

        }

        // 回写

        // 创建转换器

        TransformerFactory transformerFactory = TransformerFactory.newInstance();

        Transformer transformer = transformerFactory.newTransformer();

        transformer.transform(new DOMSource(document), new StreamResult("src/OnePiece.xml"));

    }

}

修改后XML文档内容如下：

<?xml version="1.0" encoding="UTF-8" standalone="no"?>

<海贼王>

    <草帽海贼团>

        <船长>路飞</船长>

        <厨师>山治</厨师>

        <航海士>娜美</航海士>

        <船医>乔巴</船医>

        <音乐家>布鲁克</音乐家>

    </草帽海贼团>

    <草帽海贼团>

        <副船长>索隆</副船长>

        <考古学家>罗宾</考古学家>

        <狙击手>乌索普</狙击手>

        <船工>弗兰奇</船工>

    </草帽海贼团>

</海贼王>

2019-04-05

JavaWeb学习日记----XML的解析的更多相关文章

JavaWeb学习日记----XML基础
1.XML基础: XML全称为eXtensible Markup Language;即可扩展标记型语言,同HTML一样使用标签来操作.它的可扩展性体现在标签可以由自己定义,可以是中文标签. XML用途 ...
JavaWeb学习日记----表单提交方式
1.表单提交方式 (1) 使用input控件中的submit提交代码如下: <!DOCTYPE html> <html lang="en"> <he ...
JavaWeb学习——web.xml文件说明
JavaWeb学习——web.xml文件说明摘要:本文主要学习了web.xml文件的作用以及如果配置. 是什么 web.xml文件是用来在JavaWeb项目里面初始化配置信息的,比如:访问的首页.S ...
JavaWeb学习笔记——XML解析
DOM解析操作只在跟节点<addresslist>下面建立一个子节点<name> <?xml version="1.0" encoding=&quo ...
JavaScripts学习日记——XML DTD Schema
今日关键词: XML DTD Schema 1.XML 1 XML的概述 1.1 什么是XML XML全称为Extensible Markup Language,意思是可扩展的标记语言.XML语法上和 ...
JavaWeb学习日记----SAX解析XML
1.SAX解析XML文档的方式: 与DOM方式解析不同,DOM方式解析是根据XML的层级结构在内存中分配一个树形结构,把xml的标签,属性和文本都封装成对象.优点是可以很方便实现增删改操作.缺点是,如 ...
Javaweb学习笔记——使用Jdom解析xml
一.前言 Jdom是什么? Jdom是一个开源项目,基于树形结构,利用纯java的技术对XML文档实现解析,生成,序列化以及多种操作.它是直接为java编程服务,利用java语言的特性(方法重载,集合 ...
JavaWeb学习笔记——XML和SAX解析区别
【javaweb学习】XML和约束模式
xml:可扩展标记语言,w3c组织发布的,用于保存有关系的数据,作为配置文件,描述程序模块之间的关系 <?xml version="1.0" encoding="g ...

随机推荐

C语言窗口例子
#include <windows.h> LRESULT CALLBACK WndProc( HWND, UINT, WPARAM, LPARAM ) ; //声明用来处理消息的函数 in ...
【翻译】Neural Collaborative Filtering--神经协同过滤
[说明] 本文翻译自新加坡国立大学何向南博士 et al.发布在<World Wide Web>(2017)上的一篇论文<Neural Collaborative Filtering ...
CentOS7设置固定IP
在安装完CentOS7后,当我每次启动CentOS并使用SecureCRT链接时,都发现CentOS的IP总是在变,这就很苦恼了,总不能每次链接的时候都先查一下虚拟机的IP吧,所以打算把它设置成固定I ...
从TXT文本文档向Sql Server中批量导入数据
下面我们通过以下的简单的SQL语句即可实现数据的批量导入,代码如下: Bulk insert id From 'G:\文档\test.txt' With ( fieldterminator=',', ...
MFCC特征参数提取流程概述
一概念概述: 在语音识别(Speech Recognition)和话者识别(Speaker Recognition)方面,最常用到的语音特征就是梅尔倒谱系数(Mel-scale Frequenc ...
Linux 系统下实践 VLAN
本文首发于我的公众号 Linux云计算网络(id: cloud_dev),专注于干货分享,号内有 10T 书籍和视频资源,后台回复「1024」即可领取,欢迎大家关注,二维码文末可以扫. 01 准备环境 ...
基于.net core 2.0+mysql+AceAdmin搭建一套快速开发框架
前言 .net core已经出来一段时间了,相信大家对.net core的概念已经很清楚了,这里就不再赘述.笔者目前也用.net core做过一些项目,并且将以前framework下的一些经验移植到了 ...
Android主线程的消息系统(Handler\Looper)
前言: 之前的文章写的都是关于Bitmap和内存的优化技术,这一篇文章给大家谈谈Handler. Handler是Android系统中比较重要的一个知识,在Android多线程面试经常会被问到,在实际 ...
tcp关闭状态详解
tcp关闭连接不区分客户端和服务端,哪一端口可以主动发起关闭连接请求.所以为了描述方便,描述中的“主动方”表示主动发起关闭连接一方,“被动方”表示被动关闭连接一方. 1. tcp关闭连接状态转换上图 ...
MySQL模糊匹配查询like、regexp、in
MySQL提供标准的SQL模式匹配,以及一种基于像Unix实用程序,如:vi.grep和sed的扩展正则表达式模式匹配的格式一.SQL模式(% ,_) SQL的模式匹配允许你使用“_”匹配任何单个字 ...

JavaWeb学习日记----XML的解析

JavaWeb学习日记----XML的解析的更多相关文章

随机推荐

热门专题