本文主要记录xml学习过程中的一些笔记,包括xml作用,语法以及解析。

1、HTML和XML的区别

1.1、HTML

名称:     HyperText Markup Languae(超文本标记语言)

标签:     标签是w3c组成指定,固定的,约100来个。也可以自定义标签。(自定义标签也可叫xml标签)

作用:     负责网页的结构 。被设计用来显示数据

HTML: 负责网页的结构

CSS: 负责网页的样式(美观)

Javascript: 负责在浏览器端与用户进行交互。

负责静态的网页制作的语言。HTML语言特点:

1)由标签组成。 <title> <p> <hr/> <br/>等。

2)语法结构松散的。表现在:大小写不区分,结束标签和开始标签不一定匹配。

1.2、XML

名称:Extend Markup Languge(可扩展标签语言)。是一种标记语言,很类似 HTML

标签:标签由开发者自己制定的(要按照一定的语法定义),没有被预定义。

作用:设计宗旨是传输数据,而非显示数据。被设计为具有自我描述性。

  • 描述带关系的数据(作为软件的配置文件): 包含与被包含的关系。
  • 作为数据的载体(存储数据,小型的"数据库")

2 XML作用

2.1 描述带关系的数据(软件的配置文件)

web服务器(PC):

使用ip(255.43.12.54)地址和端口(1521),连接oracle数据库,保存学生数据。

把ip地址端口配置到xml文件:

host.xml

<host>

<ip>255.43.12.55</ip>

<port>1521</port>

</host>

2.2 数据的载体(小型的"数据库")

教师管理系统:  教师信息:姓名+工龄+邮箱

当发送教师数据给财务管理系统时,可以有多种发送方式,如:

  1. 字符串发送:String teacher = name=张三&email=zhangsan@qq.com&workage=2 。此法存在问题: 1)不好解析 2)不是规范)。
  2. xml格式发送:

teacher.xml

<teacher>

<name>张三</name>

<email>zhangsan@qq.com</email>

<workage>2</workage>

</teacher>

这种一种规范

3 XML语法

xml文件以xml后缀名结尾。

xml文件需要使用xml解析器去解析。浏览器内置了xml解析器。

3.1 标签

语法: <student></student> 开始标签 标签体内容 结束标签

1)<student/> 或 <student></student> 空标签。没有标签体内容

2)xml标签名称区分大小写

3)xml标签一定要正确配对

4)xml标签名中间不能使用空格。

5)xml标签名不能以数字开头

6)注意: 在一个xml文档中,有且仅有一个根标签

3.2 属性

语法: <Student name="eric">student</Student>

注意:

1)属性值必须以引号包含,不能省略,也不能单双引号混用!!!

2)一个标签内可以有多个属性,但不能出现重复的属性名!!!

3.3 注释

语言: <!-- xml注释 --> 。在 XML 中编写注释的语法与 HTML 的语法很相似:

<!-- This is a comment --> 

3.4 xml文档声明

语法: <?xml version="1.0" encoding="utf-8"?>

version: xml的版本号

encoding: 解析xml文件时查询的码表(解码过程时查询的码表)

注意:

1)如果在ecplise工具中开发xml文件,保存xml文件时自动按照文档声明的encoding来保存文件。

2)如果用记事本工具修改xml文件,注意保存xml文件按照文档声明的encoding的码表来保存。

3.5 转义字符/实体引用

在xml中内置了一些特殊字符,这些特殊字符不能直接被浏览器原样输出。如果希望把这些特殊字符按照原样输出到浏览器,对这些特殊字符进行转义。转义之后的字符就叫转义字节。

如果你把字符 "<" 放在 XML 元素中,会发生错误,这是因为解析器会把它当作新元素的开始。

这样会产生 XML 错误:

<message>if salary < 1000 then</message>

为了避免这个错误,请用实体引用来代替 "<" 字符:

<message>if salary &lt; 1000 then</message> 

在 XML 中,有 5 个预定义的实体引用:

&lt; < 小于
&gt; > 大于
&amp; & 和号
&apos; ' 单引号
&quot; " 引号

注释:在 XML 中,只有字符 "<" 和 "&" 确实是非法的。大于号是合法的,但是用实体引用来代替它是一个好习惯。

3.6 CDATA块

作用: 可以让一些需要进行包含特殊字符的内容统一进行原样输出。

3.7 处理指令

作用: 告诉xml解析如果解析xml文档

案例: <?xml-stylesheet type="text/css" href="1.css"?> 告诉xml解析该xml文档引用了哪个css文件

需要提取xml内容可以使用xml-stylesheet指令指令

4 XML解析

4.1 引入

xml文件除了给开发者看,更多的情况使用程序读取xml文件的内容。这叫做xml解析

4.2 XML解析方式(原理不同)

DOM解析

SAX解析

4.3 XML解析工具

DOM解析原理:

1)JAXP (oracle-Sun公司官方)

2)JDOM工具(非官方)

3)Dom4J工具(非官方)

java三大框架(默认读取xml的工具就是Dom4j)

.......

SAX解析原理:

1)Sax解析工具(oracle-sun公司官方)

4.4 什么是DOM解析

DOM解析原理:xml解析器一次性把整个xml文档加载进内存,然后在内存中构建一颗Document的对象树,通过Document对象,得到树上的节点对象,通过节点对象访问(操作)到xml文档的内容。

4.5 Dom4j工具

非官方,不在java jdk中。

使用步骤:

1)导入dom4j的核心包。 dom4j-1.6.1.jar

2)编写Dom4j读取xml文件代码

public static void main(String[] args) {

try {

//1.创建一个xml解析器对象

SAXReader reader = new SAXReader();

//2.读取xml文档,返回Document对象

Document doc = reader.read(new File("./src/contact.xml"));

System.out.println(doc);

} catch (DocumentException e) {

e.printStackTrace();

throw new RuntimeException(e);

}

}

4.6 Domj4读取xml文件

节点:

Iterator Element.nodeIterator(); //获取当前标签节点下的所有子节点

标签:

Element Document.getRootElement(); //获取xml文档的根标签

Element ELement.element("标签名") //指定名称的第一个子标签

Iterator<Element> Element.elementIterator("标签名");// 指定名称的所有子标签

List<Element>     Element.elements(); //获取所有子标签

属性:

String Element.attributeValue("属性名") //获取指定名称的属性值

Attribute Element.attribute("属性名");//获取指定名称的属性对象

Attribute.getName() //获取属性名称

Attibute.getValue() //获取属性值

List<Attribute>     Element.attributes(); //获取所有属性对象

Iterator<Attribute>        Element.attibuteIterator(); //获取所有属性对象

文本:

Element.getText(); //获取当前标签的文本

Element.elementText("标签名") //获取当前标签的指定名称的子标签的文本内容

5、总结:

本文主要介绍了一下:XML的作用、XML语法以及XML解析(DOM解析),下一篇将继续学习 xPath技术、 SAX解析 、 XML约束等xml操作知识。

参考文档:http://www.w3school.com.cn/xml/xml_syntax.asp

XML学习(一)的更多相关文章

  1. XML 学习介绍 收藏

    XML学习总结(一)——XML介绍 一.XML概念 Extensible Markup Language,翻译过来为可扩展标记语言.Xml技术是w3c组织发布的,目前推荐遵循的是W3C组织于2000发 ...

  2. XML学习笔记

    XML学习笔记 第一部分:XML简介 我们经常可以听到XML.HTML.XHTML这些语言,后两者比较清楚,一直不是很明白XML是什么,这里做一个总结. XML(eXtensible Markup L ...

  3. SQL SERVER XML 学习总结

    SQL  SERVER  XML  学习总结 最新的项目任务要做一个数据同步的功能,这些天都在做技术准备,主要是用到了微软的Service Broker技术,在熟悉使用该技术的同时,又用到了Sql s ...

  4. XML学习笔记(2)--dom4j操作XML

    1. 介绍(四种方式的比较这部分转载自:http://www.blogjava.net/xcp/archive/2010/02/12/312617.html) 1)DOM(JAXP Crimson解析 ...

  5. XML学习笔记(1)--XML概述

    XML基本概念 XML—extensible Markup Language(可扩展标记语言) XML最基本的三个概念 1)XML语言---描述事物本身(可扩展) 2)XSL语言---展现事物表现形式 ...

  6. XML学习总结(二)——XML入门

    XML学习总结(二)——XML入门 一.XML语法学习 学习XML语法的目的就是编写XML 一个XML文件分为如下几部分内容: 文档声明 元素 属性 注释 CDATA区 .特殊字符 处理指令(proc ...

  7. XML学习教程

    XML学习进阶1-- 什么是XML. 为什么使用 XML?... 什么是 XML?... 数据的结构表示... XML 文档... 数据是从表示和处理中分离出来的... 使XML数据自描述... XM ...

  8. Robot framework--内置库xml学习(一)

    Using lxml By default this library uses Python's standard ElementTree module for parsing XML, but it ...

  9. Java第三阶段学习(十、XML学习)

    一.XML学习 1.模拟Servlet执行 在学习完前端及java与数据库后,将进行WEB编程阶段的学习.在WEB编程中,可以通过浏览器访问WEB服务器上的数据.这时WEB服务器就相当于另一台计算机. ...

  10. [python xml 学习篇][0]

    tree = ET.parse("Result.xml")root = tree.getroot()print type(root)print root.tag # 得到root ...

随机推荐

  1. 嵊州D2T2 八月惊魂 全排列 next_permutation()

    嵊州D2T2 八月惊魂 这是一个远古时期的秘密,至今已无人关心. 这个世界的每个时代可以和一个 1 ∼ n 的排列一一对应. 时代越早,所对应的排列字典序就越小. 我们知道,公爵已经是 m 个时代前的 ...

  2. 9.18考试 第二题Dinner题解

    当时初步感觉是一个类似动归或者贪心的神题,然而由于本题已经给出顺序,贪心貌似并没有什么道理,所以放弃贪心.然后又由于这是一个环的问题,我想到了“合并石子”那种环转链的思路,然后就是一个O(n^2*m) ...

  3. Linux基础学习整理

    linux学习记录 下载地址 centos 下载地址: 网易镜像:http://mirrors.163.com/centos/6/isos/ 搜狐镜像:http://mirrors.sohu.com/ ...

  4. webService 的使用

    webService Web service是一个平台独立的,低耦合的,自包含的.基于可编程的web的应用程序,可使用开放的XML(标准通用标记语言下的一个子集)标准来描述.发布.发现.协调和配置这些 ...

  5. Hadoop自学系列集(四) ---- Hadoop集群

    久等了,近期公司比较忙,学习的时间都没有啊,到今日才有时间呢!!!好了,下面就跟着笔者开始配置Hadoop集群吧. hosts文件和SSH免密码登录配置好了之后,现在进入Hadoop安装目录,修改一些 ...

  6. Appium+python自动化(二十五)- 那些让人抓耳挠腮、揪头发和掉头发的事 - 获取控件ID(超详解)

    简介 在前边的第二十二篇文章里,已经分享了通过获取控件的坐标点来获取点击事件的所需要的点击位置,那么还有没有其他方法来获取控件点击事件所需要的点击位置呢?答案是:Yes!因为在不同的大小屏幕的手机上获 ...

  7. python 感悟

    * 优美胜于丑陋.* 显式胜于隐式.* 简单胜于复杂.* 复杂胜于难懂.* 扁平胜于嵌套.* 稀疏胜于紧密.* 可读性应当被重视.* 尽管实用性会打败纯粹性,特例也不能凌驾于规则之上.* 不要忽略任何 ...

  8. TCP报文指针解释,IP地址

    三次握手TCP报文指针内容: 1.URG:紧急指针,当URG=1,表明紧急指针字段有效,告诉系统报文有紧急内容. 2.ACK:  确认指针,当ACK=1,确认号字段有效. 3.PSH:推送指针,当两个 ...

  9. Linux ln 命令

    Linux 中的文件分为 Hard Link 和 Symbolic Link 两种.Hard Link 文件又被称为硬链接文件.实体链接文件,Symbolic Link 文件则常被称为符号链接.软链接 ...

  10. 跟着阿里p7一起学java高并发 - 第19天:JUC中的Executor框架详解1,全面掌握java并发核心技术

    这是java高并发系列第19篇文章. 本文主要内容 介绍Executor框架相关内容 介绍Executor 介绍ExecutorService 介绍线程池ThreadPoolExecutor及案例 介 ...