
XML
SGML : 标准通用置标语言 Standard Generailzed Markup Language
XML
HTML : 超文本置标语言 HyperText Markup Language
XML : 可扩展标记语言
标记 : 指计算机所能理解的信息符号
XML 的优点 :
① 可扩展的标记
② 数据共享和重用
③ XML 遵循严格的语法要求
④ XML 便于不同系统之间信息的传输
⑤ 数据存储格式不受显示格式的制约
⑥ 包含语义的文档格式
⑦ 对面向对象(OOP)的支持 DOM
⑧ 内容与形式的分离
⑨ 具有较好的保值性
缺点:
① 语义表达能力上略显不足
② XML 的有些技术尚未形成统一的标准
③ 应用程序\浏览器对XML 的支持也是有限的
基本格式 :<标记名></标记名>
字符: > ---> > < ---> < & ---> &
" ---> " , ---> ' 空格 --->
XML 和 HTML 的主要区别:
XML 是被设计用来描述数据的,重点是:什么是数据,如何存放数据
HTML 是被设计用来显示数据的,重点是:显示数据以及如何更好地显示数据
XML 声明:
<?xml version = "XML的版本号" encoding = "采用的编码标准" standalone = "no"?>
处理指令:
<?处理指令名 处理指令信息>
DOM解析
DOM:是将xml文件全部载入,组装成一颗dom树,然后通过节点以及节点之间的关系来解析xml文件
或 将xml以树结构的方式一次性加载进内存,易用,修改方便,但是更占内存。不适应于大文件,一般情况下用它即可应付大多数应用。
DOM 是用与平台和语言无关的方式表示 XML 文档的官方 W3C 标准。DOM 是以层次结构组织的节点或信息片断的集合
DOM 解析器需要将整个文档解析一遍,并将解析结果以树型结构保存到内存中( 这棵树被称为DOM 树),然后才把程序
的控制权交给用户。这导致了DOM 方式不够灵活,需要占用大量的资源。
DOM xml文件的创建:
DocumentBuilderFactory dbf = DocumentBuilderFactory.newInstance();//获取 DocumentBuilderFactory 的新实例。
DocumentBuilder db = dbf.newDocumentBuilder();//使用当前配置的参数创建一个新的 DocumentBuilder 实例。
Document doc = db.newDocument();//获取 DOM Document 对象的一个新实例来生成一个 DOM 树。
Element root = doc.createElement("root"); //创建根结点
document.appendChild(root); //追加嵌套 setTextContent()、setAttribute() 加值
TransformerFactory tf = TransformerFactory.newInstance();// 获取 TransformerFactory 的新实例。
Transformer t = tf.newTransformer();//此抽象类的实例能够将源树转换为结果树。
t.transform(new DOMSource(root), new StreamResult("xml文件路径"));
DOM xml文件的读取:
DocumentBuilderFactory dbf = DocumentBuilderFactory.newInstance();
DocumentBuilder db = dbf.newDocumentBuilder();
Document document = db.parse("xml文件路径");
NodeList array = document.getChildNodes();
for (int i=0;i<array.getLength();i++) {
Node cla = array.item(i);
NodeList stus = cla.getChildNodes();
for (int j=0;j<stus.getLength();j++) {
Node stu = stus.item(j);
NamedNodeMap arrs = stu.getAttributes();
if (stu.getNodeName().equals("student")) { //过滤掉#test
for(int k = 0;k<arrs.getLength();k++){
Node arr = arrs.item(k);
System.out.println(arr.getNodeName()+" "+arr.getNodeValue());
}
}
}
}
Dom4j 解析
查询:
SAXReader sr = new SAXReader();
Document doc = sr.read("xml文件路径");
List<DefaultElement> list = doc.selectNodes("节点/子节点");
增加:
SAXReader sr = new SAXReader();
Document doc = sr.read("xml文件路径);
List<DefaultElement> list = doc.selectNodes("节点");
DefaultElement de = list.get(0);
Element ele = de.addElement("要增加的节点");
ele.addAttribute("要增加的属性名","要增加的值");
ele.addText("增加文本值");
XMLWriter write = new XMLWrite(new FileOutputStream("xml文件路径"));
write.write(doc); write.close();
修改:
SAXReader saxReader = new SAXReader();
Document doc = saxReader.read("xml文件路径");
List<DefaultElement> list = doc.selectNodes("节点");
DefaultElement de = list.get(0);
List<Element> list2 = de.elements();
for (Element e : list2) {
if (e.attributeValue("属性名").equals("属性值")) {
Element eleName = e.element("属性名");
eleName.setText("新值");
}
}
XMLWriter write = new XMLWrite(new FileOutputStream("xml文件路径"));
write.write(doc); write.close();
删除:
SAXReader saxReader = new SAXReader();
Document doc = saxReader.read("xml文件路径");
List<DefaultElement> list = doc.selectNodes("节点");
DefaultElement de = list.get(0);
List<Element> list2 = de.elements();
for (Element e : list2) {
if (e.attributeValue("属性名").equals("属性值")) {
de.remove(e);
XMLWriter write = new XMLWrite(new FileOutputStream("xml文件路径"));
write.write(doc); write.close();
将文档写入XML文件:
① 文档中全英文,不设置编码,直接写入
XMLWriter write = new XMLWrite(new FileOutputStream("xml文件路径"));
write.write(document); write.close();
② 文档中含有中文,设置编码格式再写入
OutputFormat format = OutputFormat.createPrettyPrint();
format.setEncoding("指定编码格式");
XMLWriter write = new XMLWrite(new FileOutputStream("xml文件路径"));
write.write(document); write.close();
创建XML文件 :
String fileName = "路径";
Document doc = DocumentHelper.createDocument();
Element root = doc.addElement("根节点");
XMLWriter writer = new XMLWriter(new File(fileName));
writer.write(doc);
writer.close();
将字符串转化为 XML 文件 :
String text = "<cla><stu> 属性 </stu></cla>";
Document doc = DocumentHelper.parseText(text);
- JAVA基础部分复习(一、8中基础类型,以及String相关内容)
以下是关于java中8种基本类型的介绍说明: package cn.review.day01; /** * java基础复习,8种数据类型 * (byte,short,long,int,double, ...
- JAVA基础-XML的解析
一.XML的概述 XML的全名为可扩展标记语言(Extensible Markup Language),XML的作用为:1.传输,2.存取数据,3.软件的配置文件.传输现在都用更轻量的Json,而存储 ...
- JAVA基础部分复习(七、JAVA枚举类型使用)
/** * java中的枚举 * 枚举(enum),是指一个经过排序的.被打包成一个单一实体的项列表.一个枚举的实例可以使用枚举项列表中任意单一项的值. * 枚举在各个语言当中都有着广泛的应用,通常用 ...
- Java基础再复习(继承、多态、方法内部类**、HashMap用法**、参数传递**)
###继承: package com.shiyan; public class Animal { public int legNum; //动物四肢的数量 //类方法 public void bark ...
- JAVA基础部分复习(六、常用关键字说明)
/** * JAVA中常用关键字复习 * final * finalize * finally * * @author dyq * */ public class KeyWordReview exte ...
- JAVA基础部分复习(二、集合类型)
对于这些常用的集合,建议还是需要先了解一下底层实现原理,这样在不同的使用场景下才能选择更好的方案. Set介绍以及对比,常用方法: package cn.review.day02; import ja ...
- Java基础知识复习(二)
Java 重写(Override)与重载(Overload) 重写 是子类对父类的允许访问的方法的实现过程进行重新编写,返回值和形参都不能改变,属于编译时多态.即外壳不变,核心重写! 重写的好处在于子 ...
- java基础 xml 使用dom4j解析 xml文件 servlet根据pattern 找到class
package com.swift.kaoshi; import java.io.File; import java.util.List; import java.util.Scanner; impo ...
- JAVA基础知识复习小结
集合 Set集合 Set集合的基本特征是元素不允许重复.HashSet不保存元素顺序,LinkedHashSet用链表保持元素的插入顺序,TreeSet可定制排序规则. HashSet的底层是用Has ...
随机推荐
- File类--随笔
package io; import java.io.File; import java.io.FileNotFoundException; import java.io.FileReader; im ...
- [转]ASP.NET Core基本原理(11)-管理应用程序状态
本文转自:http://zhuchenglin.me/fundamentals-11-app-state?utm_source=tuicool&utm_medium=referral ASP. ...
- C#基础知识-数组_ArrayList_List(九)
之前两篇文档讲述了C#中的面向对象的概念,其实这个概念对于很多种语言都是通用的,只不过每种语言具体实现的过程方法不一样,比如Java.C++.python等,这些都是很流行的面向对象的语言在编程语言排 ...
- 比较详细的mysql的几种连接功能分析,只要你看完就能学会的好东西
下面是例子分析表A记录如下: aID aNum 1 a20050111 2 a20050112 3 a20050113 4 ...
- mogondb简介
MongoDB是一款强大.灵活,且易扩展的通用型数据库,其包含以下设计特点 1.1易于使用 与关系型数据库不同的是,它没有table/rows/records,相反采用更为灵活的文档(document ...
- hibernate从零开始到各种映射
ORM(对象/关系数据库映射) 对象关系映射(Object Relational Mapping,简称ORM)是一种为了解决面向对象与关系数据库存在的互不匹配的现象的技术.它完成了面向对象的编程语言到 ...
- Python爬虫之requests模块(2)
一.今日内容 session处理cookie proxies参数设置请求代理ip 基于线程池的数据爬取 二.回顾 xpath的解析流程 bs4的解析流程 常用xpath表达式 常用bs4解析方法 三. ...
- 慧都启动“正版IDE联合超值推广计划
越来越多的中国软件企业为盗版所害而蒙受巨大损失,正版化意识逐渐兴起.IDE(集成开发环境)是软件开发.编写代码必备工具,而正版IDE更具有运行更稳定.编码更安全.保障更加完善等特点,逾为中国软件行业企 ...
- 【Mood 19】DailyBuild 2月
2月1号 仿美团loading时小人奔跑动画 HTML5定稿了,为什么原生App世界将被颠覆? -----HTML5一改过去卡顿不兼容的毛病,在硬件升级以及苹果谷歌策略变化的背景下,让自己的优势相对于 ...
- linux C之判断文件或目录是否存在 access函数
http://blog.sina.com.cn/s/blog_6a1837e90100uh5d.html access():判断是否具有存取文件的权限 相关函数 stat,open,chmod, ...