XML的解析简介:

  在学习JavaScript时,我们用的DOM来解析HEML文档,根据HTML的层级结构在内存中分配一个树形结构,把HTML的标签啊,属性啊和文本之类的都封装成对象。

  比如:document对象,element对象,属性对象,文本对象,Node结点对象

我们通常有两种方式来解析XML:DOM和SAX

  DOM解析方式:

    其实跟HTML差不多的,也是根据XML的层级结构在内存中分配一个树形结构,把XML的标签,属性和文本都封装成对象。

    缺点:如果文件过大的话,就和造成内存溢出。

    优点:可以很方便实现增删改操作。

  SAX解析方式:

    采用事件驱动,从上到下,一行一行的解析,边读边解析。解析到某一个对象时,返回对象名称。

    缺点:不能实现增删改操作

    优点:不会内存溢出,可以方便实现查询操作。

解析器:

  在解析XML时,需要解析器。针对DOM和SAX,不同的公司和组织向我们提供了不同的解析器。

  SUN公司:      jaxp

  dom4j组织:    dom4j

  jdom组织 :     jdom

  在实际开发中,dom4j用的最多

jaxp:

  jaxp解析器在JDK的javax.xml.parsers包里面。针对dom和sax分别提供了解析器:

    dom:  DocumentBuilder:  解析器类

        DocumentBuilderFactory:  解析器工厂类

    sax:  SAXParser:  解析器类

        SAXParserFactory:  解析器工厂类

那么我们具体获得JAXP中的DOM解析器的方法如下:

  调用DocumentBuilderFactory.newInstance()方法得到创建DOM解析器的工厂。

  调用工厂对象的newDocumentBuilder()方法得到解析器对象。

  调用解析器对象的parse()方法解析XML文档,该方法的参数为XML文档的URL或者封装了XML路径的文件对象。即:parse(String uri)  parse(File f)

  示例:

     // 创建解析器工厂
DocumentBuilderFactory documentBuilderFactory = DocumentBuilderFactory.newInstance();
// 获得解析器
DocumentBuilder documentBuilder = documentBuilderFactory.newDocumentBuilder();
// 解析目标XML文件
Document document = documentBuilder.parse("src/OnePiece.xml");

通过上述步骤我们就能得到代表整个文档的Document对象,就可以利用DOM特性对整个XML文档进行操纵了。

  Document接口中常用的方法:

  

 NodeList getElementsByTagName(String tagname)     按文档顺序返回包含在文档中且具有给定标记名称的所Element的 NodeList。
Element createElement(String tagName)      创建指定类型的元素。
Text createTextNode(String data)        创建给定指定字符串的 Text 节点。

  Document的父接口Node中常用的方法:

Node appendChild(Node newChild)
将节点 newChild 添加到此节点的子节点列表的末尾。
Node removeChild(Node oldChild)
从子节点列表中移除 oldChild 所指示的子节点,并将其返回。
Node getParentNode()
此节点的父节点。
String getTextContent()
此属性返回此节点及其后代的文本内容。
void setTextContent(String textContent)
此属性返回此节点及其后代的文本内容。

  在得到的NodeList集合中有下列方法可以实现遍历:

int getLength()
列表中的节点数。
Node item(int index)
返回集合中的第 index 个项。

在对Document对象进行更新操作时,都是在内存中进行的。如果想要更直观地显示在XML文档中,需要进行回写操作。即:把Document对象又重新写入到XML文件中。

示例:

现有一个XML文档内容如下:

<?xml version="1.0" encoding="UTF-8" standalone="no"?>
<海贼王>
<草帽海贼团>
<船长>路飞</船长>
<厨师>山治</厨师>
<航海士>娜美</航海士>
<船医>乔巴</船医>
<音乐家>贝多芬</音乐家> </草帽海贼团>
<草帽海贼团>
<副船长>索隆</副船长>
<考古学家>罗宾</考古学家>
<狙击手>乌索普</狙击手>
<船工>弗兰奇</船工>
</草帽海贼团>
</海贼王>

需求:将第一个<草帽海贼团>下面的<音乐家>内容贝多芬改为布鲁克

代码如下:

package com.alex;

import javax.xml.parsers.DocumentBuilder;
import javax.xml.parsers.DocumentBuilderFactory;
import javax.xml.transform.Transformer;
import javax.xml.transform.TransformerFactory;
import javax.xml.transform.dom.DOMSource;
import javax.xml.transform.stream.StreamResult;
import org.w3c.dom.Document;
import org.w3c.dom.Node;
import org.w3c.dom.NodeList; /*
* 将第一个<草帽海贼团>下面的<音乐家>内容贝多芬改为布鲁克
*/
public class OnePieceTest3 {
public static void main(String[] args) throws Exception {
// 创建解析器
DocumentBuilderFactory documentBuilderFactory = DocumentBuilderFactory.newInstance();
DocumentBuilder documentBuilder = documentBuilderFactory.newDocumentBuilder();
// 解析目标XML文件
Document document = documentBuilder.parse("src/OnePiece.xml"); // 获得目标元素集合
NodeList list = document.getElementsByTagName("草帽海贼团"); Node node = list.item(0);
NodeList childNodes = node.getChildNodes();
for (int j = 0; j < childNodes.getLength(); j++) {
Node node2 = childNodes.item(j);
String nodeName = node2.getNodeName();
if (nodeName.equals("音乐家"))
node2.setTextContent("布鲁克");
}
// 回写
// 创建转换器
TransformerFactory transformerFactory = TransformerFactory.newInstance();
Transformer transformer = transformerFactory.newTransformer();
transformer.transform(new DOMSource(document), new StreamResult("src/OnePiece.xml"));
}
}

修改后XML文档内容如下:

<?xml version="1.0" encoding="UTF-8" standalone="no"?>
<海贼王>
<草帽海贼团>
<船长>路飞</船长>
<厨师>山治</厨师>
<航海士>娜美</航海士>
<船医>乔巴</船医>
<音乐家>布鲁克</音乐家>
</草帽海贼团>
<草帽海贼团>
<副船长>索隆</副船长>
<考古学家>罗宾</考古学家>
<狙击手>乌索普</狙击手>
<船工>弗兰奇</船工>
</草帽海贼团>
</海贼王>

2019-04-05

 

JavaWeb学习日记----XML的解析的更多相关文章

  1. JavaWeb学习日记----XML基础

    1.XML基础: XML全称为eXtensible Markup Language;即可扩展标记型语言,同HTML一样使用标签来操作.它的可扩展性体现在标签可以由自己定义,可以是中文标签. XML用途 ...

  2. JavaWeb学习日记----表单提交方式

    1.表单提交方式 (1) 使用input控件中的submit提交 代码如下: <!DOCTYPE html> <html lang="en"> <he ...

  3. JavaWeb学习——web.xml文件说明

    JavaWeb学习——web.xml文件说明 摘要:本文主要学习了web.xml文件的作用以及如果配置. 是什么 web.xml文件是用来在JavaWeb项目里面初始化配置信息的,比如:访问的首页.S ...

  4. JavaWeb学习笔记——XML解析

    DOM解析操作 只在跟节点<addresslist>下面建立一个子节点<name> <?xml version="1.0" encoding=&quo ...

  5. JavaScripts学习日记——XML DTD Schema

    今日关键词: XML DTD Schema 1.XML 1 XML的概述 1.1 什么是XML XML全称为Extensible Markup Language,意思是可扩展的标记语言.XML语法上和 ...

  6. JavaWeb学习日记----SAX解析XML

    1.SAX解析XML文档的方式: 与DOM方式解析不同,DOM方式解析是根据XML的层级结构在内存中分配一个树形结构,把xml的标签,属性和文本都封装成对象.优点是可以很方便实现增删改操作.缺点是,如 ...

  7. Javaweb学习笔记——使用Jdom解析xml

    一.前言 Jdom是什么? Jdom是一个开源项目,基于树形结构,利用纯java的技术对XML文档实现解析,生成,序列化以及多种操作.它是直接为java编程服务,利用java语言的特性(方法重载,集合 ...

  8. JavaWeb学习笔记——XML和SAX解析区别

  9. 【javaweb学习】XML和约束模式

    xml:可扩展标记语言,w3c组织发布的,用于保存有关系的数据,作为配置文件,描述程序模块之间的关系 <?xml version="1.0" encoding="g ...

随机推荐

  1. 调用支付宝支付(C#)

    //支付宝支付 public string AliPay(string OrderID, string Total) //OrderID订单号,Total订单总金额 { // 支付宝网关 string ...

  2. VSCode插件开发全攻略(二)HelloWord

    更多文章请戳VSCode插件开发全攻略系列目录导航. 写着前面 学习一门新的语言或者生态首先肯定是从HelloWord开始. 您可以直接克隆我放在GitHub上vscode-plugin-demo 的 ...

  3. 玩转Kafka的生产者——分区器与多线程

    上篇文章学习kafka的基本安装和基础概念,本文主要是学习kafka的常用API.其中包括生产者和消费者, 多线程生产者,多线程消费者,自定义分区等,当然还包括一些避坑指南. 首发于个人网站:链接地址 ...

  4. 一次 Java 内存泄漏的排查

    由来 前些日子小组内安排值班,轮流看顾我们的服务,主要做一些报警邮件处理.Bug 排查.运营 issue 处理的事.工作日还好,无论干什么都要上班的,若是轮到周末,那这一天算是毁了. 不知道是公司网络 ...

  5. python爬虫学习之Scrapy框架的工作原理

    一.Scrapy简介 Scrapy是一个为了爬取网站数据,提取结构性数据而编写的应用框架. 可以应用在包括数据挖掘,信息处理或存储历史数据等一系列的程序中. 其最初是为了 页面抓取 (更确切来说, 网 ...

  6. 调皮的程序员:Linux之父雕刻在Linux内核中的故事

    本文内容由公众号“格友”原创分享. 1.引言   (不羁的大神,连竖中指都这么帅) 因为LINUX操作系统的流行,Linus 已经成为地球人都知道的名人.虽然大家可能都听过钱钟书先生的名言:“假如你吃 ...

  7. Spring 通知和顾问进行增强

    使用顾问增加前置增强和后置增强 <bean id="1" class="目标对象"></bean> <bean id=" ...

  8. 屌炸天,Oracle 发布了一个全栈虚拟机 GraalVM,支持 Python!

    前阵子,Oracle 发布了一个黑科技 "GraalVM",号称是一个全新的通用全栈虚拟机,并具有高性能.跨语言交互等逆天特性,真有这么神奇? GraalVM 简介 GraalVM ...

  9. 浅谈React16框架 - Fiber

    前言 React实现可以粗划为两部分:reconciliation(diff阶段)和 commit(操作DOM阶段).在 v16 之前,reconciliation 简单说就是一个自顶向下递归算法,产 ...

  10. python基础-字符串(6)

    一.引言 当打来浏览器登录某些网站的时候,需要输入密码,浏览器把密码传送到服务器后,服务器会对密码进行验证,其验证过程是把之前保存的密码与本次传递过去的密码进行对比,如果相等,那么就认为密码正确,否则 ...