xml解析技术
本文总结Dom,sax解析, 使用Java作为工具解析xml文档。
1 Dom
综述:Dom解析xml通常也称为xmlDom (和htmlDom技术差不多),将xml文档封装成树,好处就是xml中的标签(属性)和Dom树
中的节点一 一对应。节点都是对象,这样就可以使用对象的属性或者方法就操作xml。
缺点:每一种技术都会有缺点,Dom解析的不足之处在于不是处理数据量大的xml文件,原因:Dom技术是直接将xml解析成树,装入到内存中,
这样消耗的资源会比较多。
以下面Myclass.xml为例
<?xml version="1.0" encoding="utf-8"?>
<class>
<stu id="sp001">
<name>小明</name>
<age>12</age>
<Math>100</Math>
<English>90</English>
</stu>
<stu id="sp002">
<name>小李</name>
<age>12</age>
<Math>98</Math>
<English>90</English>
</stu>
</class>
(1)代码实现
先解析xml 获取文档对象Document
public void GetDocument(url) {
DocumentBuilderfactory dbf=DocumentBuilderfactory.newInstance();//创建工厂
DocumentBuilder bu=dbf.newDocumentBuilder();//Dom解析器
Document document=bu.Parse(url) //解释文档返回文档对象,url为路径;
}
* 接下来以添加一个节点:
public addNode(Document doc){
//创建节点
Element stu=doc.CreateElement("stu");
Element name=doc.CreateElement("name");
Element age=doc.CreateElement("age");
//添加属性和文本
stu.setAttribute("id","sp003");//id属性
name.setTextContent("小刘");
age.setTextContent("11");
//将节点添加stu中再到文档中
stu.appendChild(name);
stu.appendChild(age);
doc.getDocumentElement.getChild(stu);//添加到xml文档中;
//调用刷新函数(自定义),也是就三句话:工厂,对象,刷新;
}
注释:上面讲到了刷新函数,干什么的?
我们将stu节点添加到文档中,注意不是直接到xml的,也是在内存中,只有刷新到xml文档中才会使得xml中可以看到新加的节点;
所以要刷,具体怎么写,我真是忘记了! 这里记为 refresh();
* 至于修改,删除那就差不多的。不介绍
(2)居然Dom技术可以作用于xml和html,那有什么相似的地方?
我是先学习htmlDom的,在html中我们通常使用属性去修改,设置值;比如
document.getElementById('stu')..id="xxx";//添加id属性(说是设置也行);
document.getElementById('name')..innerText="xxx";//添加文本;
html中基本上使用属性,方法使用的不多,原因简单:属性操作不用考虑"浏览器兼容";
对比xml中使用方法(基本上没有属性),解析xml文档也就没有什么“兼容不兼容”的事情!
所以html会了,xml的解析也就差不多了。
2 sax解析
综述:
sax技术可以用来处理xml比较大的情况,Dom技术是做不到的
为什么Dom不能?sax可以?
原因就是Dom技术是直接将xml解析成树,装入到内存中,这样消耗的资源会比较多。
所以不适合处理数据较多时xml。sax技术不一样,他不用直接将xml装入到内存中,只是将需要的数据
装进去。不会大量的消耗内存资源。sax技术适合处理遍历,读取。不适合(不能)用来修改数据。
原理 :
sax技术主要是使用DefaultHander事件处理对象;
比如里面有方法:
& public void startElement(String uri, String localName, String qName, Attributes attributes) {//code}
每一次访问<>都会调用一次;
看参数: qName是<>里的标签名,比如:<stu id="sp002">那么qName就是stu.。attributes数组,用来保存标签的属性。比如
attributes.getValue("id"));就是"sp002"; 我们可以在code中处理,得到我们需要的!
& public void characters(char[] ch, int start, int length) {} //查看DefaultHander文档
(1)实现
* 将xml文件和事件处理对象关联起来
public SaxFunction(url){
SAXParserFactory factory=SAXParserFactory.newInstance();
SAXParser sax=factory.newSAXParser();
sax.parse(url,new MyHander()); //将xml文件和事件处理对象关联起来,这个对象是自定义的!
}
* 重写事件对象DEfaultHander的方法
class MyHander extends DefaultHandler{
private String name=""; // 关联属性;
@Override
public void characters(char[] ch, int start, int length) throws SAXException {
String con=new String(ch,start,length);
if(!con.trim().equals("")&&(this.name.equals(name) || this.name.equals("age")))
System.out.println(con);
}
@Override
public void startElement(String uri, String localName, String qName, Attributes attributes) throws SAXException {
if(qName=="stu")
{
System.out.println(attributes.getValue("id"));
}
}
}
注释:我们可以看到上面代码可拿到 属性"id",元素name,age的文本; 都是sax技术是不能添加,删除,修改数据的。这就是他的缺点。
其他xml解析技术如:JDom,Dom4j。有时间在讨论!
xml解析技术的更多相关文章
- Android实现XML解析技术
转载:Android实现XML解析技术 本文介绍在Android平台中实现对XML的三种解析方式. XML在各种开发中都广泛应用,Android也不例外.作为承载数据的一个重要角色,如何读写XML成为 ...
- XML解析技术研究(一)
摘要:XML作为过去十年中出现的最流行的技术之一,得到了广泛的应用,而其中XML解析技术是XML应用的关键.本文介绍了XML解析技术的研究动向,分析和比较了4种XML解析技术的优劣,并归纳总结了应 ...
- Java数据库编程、XML解析技术
数据库编程 JDBC概述 是Java Database Connecive,即数据库连接技术的简称,它提供了连接各种常用数据库的能力. 是一种用于执行SQL语句的Java API,可以为多种关系数据库 ...
- 一文读懂四种常见的XML解析技术
之前的文章我们讲解了<XML系列教程之Schema技术_上海尚学堂java培训技术干货><XML的概念.特点与作用.XML申明_上海Java培训技术干货>,大家可以点击回顾一下 ...
- Java数据库编程及Java XML解析技术
1.JDBC概述 A. 什么是JDBC? Java DataBase Connectivity:是一种用于执行SQL语句的Java API,它由一组用Java语言编写的类和接口组成.通过这些类和接口 ...
- XML解析技术简介——(一)
- XML 解析技术
xml 解析方式有两种: dom 解析和 sax 解析: 针对着两种解析方式,有三种解析器: sun公司的 jaxp dom4j 组织的 dom4j jdom 组织的 jdom dom 解析XML : ...
- JAVA数据库编程、JAVA XML解析技术
JDBC概述 JDBC是JAVA中提供的数据库编程API curd :数据库增删改 链接字符串:String url = "mysql :/localhost :3306/jdbc/&quo ...
- XML解析技术-dom4j
随机推荐
- error LNK2001: 无法解析的外部符号
1.错误描述 error LNK2001: 无法解析的外部符号 "__declspec(dllimport) void __cdecl PadSystem::Private::printQS ...
- python爬虫学习(9) —— 一些工具和语法
1. Beautiful Soup 在它的官网有这样一段话: You didn't write that awful page. You're just trying to get some data ...
- ongl(原始类型和包装类型)
原始类型和包装类型 //首先创建两个实体类 user 和 address user中包含address package cn.jbit.bean; public class User { //用户类 ...
- Salesforce Apex 使用JSON数据的示例程序
本文介绍了一个在Salesforce Apex中使用JSON数据的示例程序, 该示例程序由以下几部分组成: 1) Album.cls, 定了了封装相关字段的数据Model类 2) RestClient ...
- iOS CALayer应用详解
跟着大神一起进步,本篇博客原文地址:http://blog.csdn.net/hello_hwc?viewmode=contents 一 CALayer是什么? Layers是绘图和动画的基础, L ...
- web兼容学习分析笔记--块级、内联、内联块级元素
一.块级.内联.内联块级元素 (1)块级元素:block **独占一行 **可设置width,height,margin,padding **内部可包含块级或内联元素 (3)内联(行内)元素:inli ...
- css:子元素div 上下左右居中方法总结
最近在面试,不停地收到了知识冲击,尤其是对于一些基础的css.html.js问题居多,所以自我也在做反思,今天就css问题,如何让一个子元素div块元素上下左右居中 (以下总结方法,都已得到验证). ...
- caffe源码解析
http://blog.csdn.net/lanxuecc/article/details/53186613
- rank()函数的使用
排序: ---rank()over(order by 列名 排序)的结果是不连续的,如果有4个人,其中有3个是并列第1名,那么最后的排序结果结果如:1 1 1 4select scoreid, stu ...
- Android换肤技术总结
原文出处: http://blog.zhaiyifan.cn/2015/09/10/Android%E6%8D%A2%E8%82%A4%E6%8A%80%E6%9C%AF%E6%80%BB%E7%BB ...