XML的概述,.Dom4解析和SAX解析
1.什么是XML
XML 指可扩展标记语言(EXtensible Markup Language) html(hyper text markup langauge)
XML 是一种标记语言,很类似 HTML
XML 的设计宗旨是传输数据,而非显示数据(webservice)
XML 标签没有被预定义。您需要自行定义标签。
XML 被设计为具有自我描述性。
XML 是 W3C 的推荐标准
XML可以存储数据(小型数据库)
XML可以作为框架的配置问 web.xml applicationContext.xml(spring的配置文件) ,hibernate.cfg.xml
2.XML与HTML的主要区别
- XML 不是 HTML 的替代。
- XML 和 HTML 为不同的目的而设计:
- XML 被设计为传输和存储数据,其焦点是数据的内容。
- HTML 被设计用来显示数据,其焦点是数据的外观。
- HTML 旨在显示信息,而 XML 旨在传输信息。
3.XML语法
- XML 标签对大小写敏感
- XML 元素都须有关闭标签<student> </student>
- XML 文档必须有根元素
- XML 的属性值须加引号
4.XML命名规则
XML 元素必须遵循以下命名规则:
名称可以含字母、数字以及其他的字符
名称不能以数字或者标点符号开始
名称不能以字符 “xml”(或者 XML、Xml)开始
名称不能包含空格
可使用任何名称,没有保留的字词。
5.特殊字符
| < | "<" | 小于 |
| > | > | 大于 |
| & | & | 和号 |
| ' | ' | 单引号 |
| " | " | 引号 |
2.XML解析
文档:

根据xml文件创建对应的类

3.Dom4解析
3.1什么是Dom4j
dom4j是一个Java的XML API,是jdom的升级品,用来读写XML文件的。dom4j是一个十分优秀的javaXML API,具有性能优异、功能强大和极其易使用的特点,它的性能超过sun公司官方的dom技术,同时它也是一个开放源代码的软件,可以在SourceForge上找到它。在IBM developerWorks上面还可以找到一篇文章,对主流的Java XML API进行的性能、功能和易用性的评测,所以可以知道dom4j无论在哪个方面都是非常出色的。如今可以看到越来越多的Java软件都在使用dom4j来读写XML,特别值得一提的是连Sun的JAXM也在用dom4j。这已经是必须使用的jar包, Hibernate也用它来读写配置文件。
3.2 核心类
SAXReader Demo4读取文件的类
常用方法:
read 读取指定的xml文件
Document 文档类 用于加载指定的文档
常用方法:
getRootElement 获取根节点
Element 标签类,元素
常用方法:
elements 获取所有的直接子标签
attribute 获取指定属性名称的属性对象
elementText 获取指定子标签名称的文本内容
element 获取指定标签名称的标签对象
getText(); 得到当前标签中间的文本
3.3 实现xml解析

4.SAX解析
4.1 什么是SAX
SAX,全称Simple API for XML,既是一种接口,也是一种软件包。它是一种XML解析的代替方法。SAX不同于DOM解析,它逐行扫描文档,一边扫描一边解析。由于应用程序只是在读取数据时检查数据,因此不需要将数据存储在内存中,这对于大型文档的解析是个巨大优势
dom:把XML文件读取到内容,构建树形结构
4.2 SAX优缺点
SAX的优点:
解析速度快
占用内存少
SAX的缺点:
无法知道当前解析标签(节点)的上层标签,及其嵌套结构,仅仅知道当前解析的标签的名字和属性,要知道其他信息需要程序猿自己编码
只能读取XML,无法修改XML
无法随机访问某个标签(节点)
SAX解析适用场合
SAX解析适用场合 对于CPU资源宝贵的设备,如Android等移动设备对于只需从xml读取信息而无需修改xml
4.3 代码实现
创建自定义处理数据的模板类
继承DefaultHandler类
重新四个方法
startDocument();解析到xml文件的开始
startElement();解析到标签的开头 <book>
endElement(); 解析到标签结尾</book>
character(); 解析到标签中间的文本
代码:
public classMyBookHandler extends DefaultHandler
{/* 声明解析后存储对象的集合*/
private Book book;
private List<Book>books;
private String tagName;//当前解析的标签
public list<Book> getBooks(){
return books;
}
public void startDocument() throws SAXException{
System.out.println("文档的开始");
}
public void endDocument()throws SAXException{
System.out.println("文档的结束");
}
/*解析到标签的开头String qName 解析到的标签的名称<book id="1001">
Attributes attributes 当前这个标签中的属性 id="1001" */
public void startElement (String uri,String localName,String qName,Attributes attributes) throws SAXException{
if("books".equals(qName)){
books=new ArrayList<>();
}else if("book".equals(qName)){
book=new Book();
String ids=attributes.getValue("id");
String date=attributes.getValue("publishdate");
book.setId(Integer.parseInt(ids));
book.setPublishdate(date);
}
tagName=qName;
}
/*解析到标签的结尾
@param uri
@param localName
@param qName
@throws SAXEXception */
public void endElement(String uri,String locatiion,String qName)throws SAXException{
//Sysem.out.println(“标签的结尾”+qName);
tagName=" ";
if("book"equals (qName))
{
book.add(book);
}
/*** 解析到文本
* @param ch
* @param start
* @param length
* @throws SAXException */
public void characters(char[] ch, int start, int length) throws SAXException {
// 把char类型的数组--->string
String content = new String(ch,start,length);
//System.out.println(content);//有可能得到换行符或者空格
content = content.trim();
//System.out.println("处理后:"+content+"---标签"+tagName);
//book.setName(content);
if ("name".equals(tagName)) {//""
book.setName(content);
}else if("author".equals(tagName)) {
book.setAuthor(content);
}else if("price".equals(tagName)) {
//book.setPrice(Double.parseDouble(content));
}
}
使用SAX进行解析
伪代码:

具体代码:

扩展:DOM解析
dom解析:xml文件加载到内存中,在内存中构建树形结构,文件比较大,不建议使用DOM解析
核心API:
DocumentBuilderFactory
DocumentBuilder
Document xml文档
Node xml文件中的一个节点(标签节点,属性节点,空格或者注释等也是Node对象)
getNodeName(); 标签名称
getNodeValue(); 属性值
getAttributes() ; 得到属性列表
getTextContent();标签中的文本
NodeList: 子节点列表
Attribute 属性对象


XML的概述,.Dom4解析和SAX解析的更多相关文章
- 经典面试题:一张表区别DOM解析和SAX解析XML
============DOM解析 vs ...
- Dom4j解析和sax解析xml
xml基础知识 1)标签对大小写敏感,2)xml解析方式有两种dom解析和sax解析 3)常用的解析工具有dom的dom4j和sax的sax解析工具 4)文档声明中使用<?xml versio ...
- java解析XML之DOM解析和SAX解析(包含CDATA的问题)
Dom解析功能强大,可增删改查,操作时会将XML文档读到内存,因此适用于小文档: SAX解析是从头到尾逐行逐个元素解析,修改较为不便,但适用于只读的大文档:SAX采用事件驱动的方式解析XML.如同在电 ...
- XML解析(二) SAX解析
XML解析之SAX解析: SAX解析器:SAXParser类同DOM一样也在javax.xml.parsers包下,此类的实例可以从 SAXParserFactory.newSAXParser() 方 ...
- XML 解析---dom解析和sax解析
眼下XML解析的方法主要用两种: 1.dom解析:(Document Object Model.即文档对象模型)是W3C组织推荐的解析XML的一种方式. 使用dom解析XML文档,该解析器会先把XML ...
- DOM解析和SAX解析的区别
DOM解析和SAX解析的区别 博客分类: XML DOM SAX DOM解析和SAX解析的区别 No 区 别 DOM解析 SAX解析 1 操作 将所有文件读取到内存中形成DOM树,如果文件量过大,则 ...
- java拾遗2----XML解析(二) SAX解析
XML解析之SAX解析: SAX解析器:SAXParser类同DOM一样也在javax.xml.parsers包下,此类的实例可以从 SAXParserFactory.newSAXParser() 方 ...
- 非常简单的XML解析(SAX解析、pull解析)
这里只是把解析的数据当日志打出来了 非常简单的xml解析方式 package com.example.demo.service; import java.io.IOException; import ...
- 解析XML的几种方法之SAX解析
假期总结不能停,坚持坚持....接下来总结一下XMl和json的解析和生成.. 解析XML的四种方法,即:DOM.SAX.JDOM和DOM4J 下面首先给出这四种方法的jar包下载地址: DOM:在现 ...
随机推荐
- 在腾讯云centos7.2上安装配置Node.js记录
应为爱好前端所以打算在腾讯云服务器上安装JavaScript引擎Node.js,下面是安装步骤: 安装准备: 下载node.js的.tar.xz安装包:https://nodejs.org/dist/ ...
- 利用Load命令将本地文本里面的数据导入到MySQL数据库
摘要:在使用MySQL是我们可能会遇到要向我们的表中插入大量的数据如果都使用以下的语句在命令行输入有点不太切实际,幸好MySQL为我们提供了LOAD命令可以批量的从本地文件向MySQL表中导入数据! ...
- Centos7上pkg-config的安装
1.官网下载自己想要的版本,我这里下载的是目前最新版 https://www.freedesktop.org/wiki/Software/pkg-config/ 2.安装 tar xf XXX.tgz ...
- 移动 H5 首屏秒开优化方案探讨
转载bang大神文章,原文<移动 H5 首屏秒开优化方案探讨>,此文仅仅用做自学与分享! 随着移动设备性能不断增强,web 页面的性能体验逐渐变得可以接受,又因为 web 开发模式的诸多好 ...
- nginx增加访问验证
使用OpenSSL实用程序创建密码文件 如果您的服务器上安装了OpenSSL,则可以创建没有附加软件包的密码文件.我们将在/ etc / nginx配置目录中创建一个名为.htpasswd的隐藏文件来 ...
- Cisco2960 交换机密码破解方法
1. 启用超级终端并出现连接界面2. 拔掉交换机的电源3. 按下交换机上的 Mode按钮, 与此同时重新插上交换机的电源线4. 当交换机左边的sys 灯会慢慢的闪动, ( 细心的话会发现部分灯红色的闪 ...
- 一致性 Hash 算法分析
当我们在做数据库分库分表或者是分布式缓存时,不可避免的都会遇到一个问题: 如何将数据均匀的分散到各个节点中,并且尽量的在加减节点时能使受影响的数据最少. Hash 取模 随机放置就不说了,会带来很多问 ...
- Design Patterns | 01 为什么要尽早掌握设计模式
标题:Design Patterns | 01 为什么要尽早掌握设计模式 链接: 标签:设计模式 摘要:设计模式是前人经验的总结,教大家如何写出可扩展.可读.可维护的高质量代码.设计模式与日常工作中的 ...
- 量化投资学习笔记30——《Python机器学习应用》课程笔记04
有监督学习 常用分类算法 KNN:K近邻分类器.通过计算待分类数据点,与已知数据中所有点的距离,取距离最小的前K个点,根据"少数服从多数"的原则,将这个数据点划分为出现次数最多的那 ...
- hive、Hbase、mysql的区别
1.Hive和HBase的区别 1)hive是sql语言,通过数据库的方式来操作hdfs文件系统,为了简化编程,底层计算方式为mapreduce. 2)hive是面向行存储的数据库. 3)Hive本身 ...