• xml的知识结构图

  eXtensible Markup Language,可扩展标记语言,简称XML,和HTML比较而言,语法相似,作用不同

  XML被设计用来存储和传输数据,但存储数据方面,数据库是主流;传输数据方面会越来越多的使用JSON数据格式;

  另一个额外的作用就是作为项目的配置文件使用,但这方面注解会越来越流行

  • xml语法
  1. 必须以XML声明开头  <?xml version="1.0" encoding="UTF-8"?>
  2. 必须拥有唯一的根元素
  3. 元素可以包含若干属性、子元素以及文本内容
  4. 开始标签必须与结束标签相匹配
  5. 标签必须正确地嵌套,不能交叉
  6. 标签名大小写敏感
  7. 支持实体字符和CDATA区 <![CDATA[ ]]>
  8. 有的空白字符是有意义的,不应该被忽略
<?xml version="1.0" encoding="UTF-8"?>
<users>
<user id="u001" name="蛋蛋">
<email>dandan@rupeng.com</email>
<phones>
<phone>13700000001</phone>
<phone>18000000001</phone>
</phones>
</user>
</users>
  • DTD约束

  通过约束可以限定XML文件结构,有助于确保数据的正确性,也为校验XML提供了依据。使用DTD约束XML时,可以规定文档包含哪些元素、元素顺序、元素个数、子元素情况、属性及属性值、默认值等等

  DTD约束语法

  元素声明:<!ELEMENT 元素名称 元素内容>

  属性声明:<!ATTLIST 元素名称  属性列表>

  元素内容的类型:ANY、EMPTY、#PCDATA、子元素列表

    子元素列表中可使用一些特殊符号:

  ,  逗号表示元素按声明顺序出现

    |  表示元素只能出现其中一个元素

   +   表示元素至少出现一次

   表示元素可以出现0次或多次

   ?  表示元素出现0次或1次

  属性类型:ID、CDATA、(enum1|enum2|enum3..)枚举

  属性值约束:、默认值、#REQIRED、#IMPLIED

<!ELEMENT users (user*)>
<!ELEMENT user (email+,phones?)>
<!ELEMENT email (#PCDATA)>
<!ELEMENT phones (phone*)>
<!ELEMENT phone (#PCDATA)>
<!ATTLIST user
id ID #REQUIRED
name CDATA #IMPLIED
>

  可以把上面的DTD约束代码单独放在一个.dtd文件中,然后使用<!DOCTYPE>引用

  引用本地DTD文件:

<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE users SYSTEM "users.dtd">
<users>
<user id="u001" name="蛋蛋">
<email>dandan@rupeng.com</email>
<phones>
<phone>13700000001</phone>
<phone>18000000001</phone>
</phones>
</user>
</users>

  引用网上DTD文件:

<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE users PUBLIC "dtd名称" "DTD文件路径">
<users>
<user id="u001" name="蛋蛋">
<email>dandan@rupeng.com</email>
<phones>
<phone>13700000001</phone>
<phone>18000000001</phone>
</phones>
</user>
</users>
  • schema约束

  schema是另一种XML约束方式,它比DTD更加复杂,但功能更强大

 schema文件本质上是XML文件,约束步骤如下:

  1 由W3C组织事先定义好一组基本规则

使用<element>定义一个新元素

使用<complexType>表示此元素为复合元素

使用<sequence>表示子元素需要按照定义的顺序出现

使用<attribute>定义元素的属性

. . .

  2 由开发人员使用上述基本规则定义自己的规则

<?xml version="1.0" encoding="UTF-8"?>
<schema xmlns="http://www.w3.org/2001/XMLSchema" targetNamespace="mystudents" >
<element name="students" >
<complexType>
<sequence>
<element name="student" maxOccurs="unbounded">
<complexType>
<sequence>
<element name="name" type="string"></element>
</sequence>
</complexType>
</element>
</sequence>
</complexType>
</element>
</schema>

  3 开发人员使用自己的规则约束自己的XML文件

<?xml version="1.0" encoding="UTF-8"?>
<students xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
xmlns="mystudents" xsi:schemaLocation="mystudents /students.xsd">
<student>
<name>蛋蛋</name>
</student>
<student>
<name>建国</name>
</student>
</students>

  由于schema语法太过庞杂,而且工作时几乎不会自己去写schema文件,所以只需要了解schema的原理,会引入现有的schema文件即可

  • xml的解析

  无论XML用来存储数据、传递数据还是做配置文件,终究都需要解析XML文件取出想要的数据。XML文件解析有多种方式,这里只介绍DOM解析方式和SAX解析方式。JDK对这两种方式都提供了支持,相关API分布在javax.xml、org.w3c.dom、org.xml.sax包及其子包下。

  DOM解析方式

  XML DOM和JavaScript DOM非常相似,有两个核心类org.w3c.dom.Document和org.w3c.dom.Element

  Document表示整个XML文档,提供了getElementsByTagName()和getElementById()等方法查找想要操作的Element对象

  Element表示XML元素,通过getAttribute()、getTextContent()、getElementsByTagName()等方法分别获得属性值、获得元素体文本内容、查找子元素等

public class DOMTest {
public static void main(String[] args) throws Exception {
// 解析users.xml,得到List<User>
// 获得document对象
DocumentBuilderFactory documentBuilderFactory = DocumentBuilderFactory.newInstance();
DocumentBuilder documentBuilder = documentBuilderFactory.newDocumentBuilder();
String path = DOMTest.class.getResource("/users.xml").getFile();
Document document = documentBuilder.parse(path); List<User> userList = new ArrayList<User>(); //获得所有的user元素
NodeList userNodeList = document.getElementsByTagName("user"); for (int i = 0; i < userNodeList.getLength(); i++) {
User user = new User(); Element userElement = (Element) userNodeList.item(i);
String name = userElement.getAttribute("name");
user.setName(name);
String id = userElement.getAttribute("id");
user.setId(id); //获得当前user下的所有email子元素
NodeList emailNodeList = userElement.getElementsByTagName("email");
for (int j = 0; j < emailNodeList.getLength(); j++) {
Element emailElement = (Element) emailNodeList.item(j);
String email = emailElement.getTextContent();
user.setEmail(email);
} List<String> phones = new ArrayList<String>();
//获得当前user下的所有phone子元素
NodeList phoneNodeList = userElement.getElementsByTagName("phone");
for (int m = 0; m < phoneNodeList.getLength(); m++) {
Element phoneElement = (Element) phoneNodeList.item(m);
String phone = phoneElement.getTextContent();
phones.add(phone);
}
user.setPhones(phones);
userList.add(user);
}
System.out.println(userList);
}
}

  SAX解析方式

  SAX(Simple API for XML)基本思路:在读取XML文件内容的过程中,会按照文件结构有规律的发生读取开始标签、读取标签体内容、读取结束标签这三种动作,

  开发人员可以根据XML文件结构特点,当发生不同动作的时候进行不同的处理,最终获取想要的数据。

  解析过程如下:

  1 编写处理器类,对不同的动作进行不同的处理

public class UserXMLHandler extends DefaultHandler {

    private User user;
private String content; // 临时记录一个标签的文本内容
public User getUser() {
return user;
} @Override
public void startElement(String uri, String localName, String qName, Attributes attributes) throws SAXException {
// System.out.println("读取到" + qName + "的开始标签");
if ("user".equals(qName)) {
user = new User();
String id = attributes.getValue("id");
String name = attributes.getValue("name");
user.setId(id);
user.setName(name);
} else if ("email".equals(qName)) { }
} @Override
public void characters(char[] ch, int start, int length) throws SAXException {
// System.out.println("读取到一段文本内容:" + new String(ch, start, length));
content = new String(ch, start, length);
}
@Override
public void endElement(String uri, String localName, String qName) throws SAXException {
// System.out.println("读取到" + qName + "的结束标签");
if ("email".equals(qName)) {
user.setEmail(content);
} else if ("phone".equals(qName)) {
user.setPhone(content);
}
}
}

  2 执行解析并获取解析结果

public static void main(String[] args) throws Exception {
File xmlFile = new File(SAXTest.class.getResource("/user.xml").getFile());
UserXMLHandler userXMLHandler = new UserXMLHandler(); SAXParserFactory saxParserFactory = SAXParserFactory.newInstance();
SAXParser saxParser = saxParserFactory.newSAXParser();
saxParser.parse(xmlFile, userXMLHandler); User user = userXMLHandler.getUser();
System.out.println(user);
}

关于XML的一些总结的更多相关文章

  1. XStream将java对象转换为xml时,对象字段中的下划线“_”,转换后变成了两个的解决办法

            在前几天的一个项目中,由于数据库字段的命名原因 其中有两项:一项叫做"市场价格"一项叫做"商店价格" 为了便于区分,遂分别将其命名为market ...

  2. .NET Core采用的全新配置系统[9]: 为什么针对XML的支持不够好?如何改进?

    物理文件是我们最常用到的原始配置的载体,最佳的配置文件格式主要由三种,它们分别是JSON.XML和INI,对应的配置源类型分别是JsonConfigurationSource.XmlConfigura ...

  3. WebApi接口 - 响应输出xml和json

    格式化数据这东西,主要看需要的运用场景,今天和大家分享的是webapi格式化数据,这里面的例子主要是输出json和xml的格式数据,测试用例很接近实际常用情况:希望大家喜欢,也希望各位多多扫码支持和点 ...

  4. XML技术之DOM4J解析器

    由于DOM技术的解析,存在很多缺陷,比如内存溢出,解析速度慢等问题,所以就出现了DOM4J解析技术,DOM4J技术的出现大大改进了DOM解析技术的缺陷. 使用DOM4J技术解析XML文件的步骤? pu ...

  5. UWP开发之Mvvmlight实践六:MissingMetadataException解决办法(.Net Native下Default.rd.xml配置问题)

    最近完成一款UWP应用,在手机端测试发布版(Release)的时候应用莫名奇妙的强行关闭,而同样的应用包在PC端一点问题都没有,而且Debug版在两个平台都没有问题,唯独手机的Release版有问题. ...

  6. PHP中遍历XML之SimpleXML

    简单来讲述一些XML吧,XML是可扩展标记语言,是一种用于标记电子文件使其具有结构性的标记语言.XML是当今用于传输数据的两大工具之一,另外一个是json. 我们在PHP中使用XML也是用来传输数据, ...

  7. Asp.Net 操作XML文件的增删改查 利用GridView

    不废话,直接上如何利用Asp.NET操作XML文件,并对其属性进行修改,刚开始的时候,是打算使用JS来控制生成XML文件的,但是最后却是无法创建文件,读取文件则没有使用了 index.aspx 文件 ...

  8. Mybatis XML配置

    Mybatis常用带有禁用缓存的XML配置 <?xml version="1.0" encoding="UTF-8" ?> <!DOCTYPE ...

  9. Drawable实战解析:Android XML shape 标签使用详解(apk瘦身,减少内存好帮手)

    Android XML shape 标签使用详解   一个android开发者肯定懂得使用 xml 定义一个 Drawable,比如定义一个 rect 或者 circle 作为一个 View 的背景. ...

  10. C#反序列化XML异常:在 XML文档(0, 0)中有一个错误“缺少根元素”

    Q: 在反序列化 Xml 字符串为 Xml 对象时,抛出如下异常. 即在 XML文档(0, 0)中有一个错误:缺少根元素. A: 首先看下代码: StringBuilder sb = new Stri ...

随机推荐

  1. WebFlux系列(十二)MongoDB应用,新增、修改、查询、删除

    #Java#Spring#SpringBoot#Mongo#reactor#webflux#数据库#新增#修改#查询#删除# Spring Boot WebFlux Mongo数据库新增.删除.查询. ...

  2. python 变量搜寻顺序法则LEGB之E注意事项

    众所周知,在python中,变量不需要事先声明,赋值后,即可调用使用.而调用的法则遵从LEGB法则,其中L为local,E为enclosing,G为Global,B为built-in,即变量首先在局部 ...

  3. openstack trove weekly meeting时间即将更改

    为了平衡英国.巴黎.德国.美国和中国开发者的作息习惯,openstack trove项目组在5月18日的weekly meeting上开始讨论新的开会时间. 当前的开会时间是,周三 UTC 18:00 ...

  4. Linux环境创建交换分区

    最近在准备在移动端跑一下深度学习训练好的模型,在RK3399的板子上安装scipy时报错.网上查了一下,由于内存不足导致,做个交换分区就搞定了.那么如何做交换分区呢.话不多说,直接开撸. ------ ...

  5. 字符串编码研究:Unicode

    Unicode Unicode 编码系统可分为编码方式和实现方式两个层次. 1.编码方式 Unicode字符平面映射定义了所有的Unicode字符集. 2.实现方式(UTF8,UTF16) UTF-8 ...

  6. Java固定资产管理系统 源码 jsp ssh

    固定资产管理系统是对高校固定资产的一个信息化管理系统,基本功能包括:对固定资产的购进.接触.销毁,对物品的使用状态.借出状态.库存状态等进行标识,对各类物品进行编号,根据编号进行查询,根据名称进行查询 ...

  7. LeetCode——139. 单词拆分

    给定一个非空字符串 s 和一个包含非空单词列表的字典 wordDict,判定 s 是否可以被空格拆分为一个或多个在字典中出现的单词. 说明: 拆分时可以重复使用字典中的单词. 你可以假设字典中没有重复 ...

  8. JavaWeb开发中遇到问题汇总

    一.基础问题 1.${pageContext.request.contextPath}获取相对路径无效 问题:在jsp中使用${pageContext.request.contextPath}获取相对 ...

  9. ansible删除目录下所有内容

    使用ansible的同学都知道,ansible只支持新增删除具体的某个文件夹或者文件,如下所示: 1. 创建目录,删除整个目录 - name: Create a directory if it doe ...

  10. 2020 年最流行的 Java 开发技术

    不知不觉间,2020 年即将于十几天之后到来,作为技术圈中你,准备好迎接最新的变化了吗?在本文中,我们将以编程界最常用的编程语言 Java 为例,分享最为主流的技术与工具. 作者 | divyesh. ...