1 XML概述

  • XML是指可扩展的标记语言,很类似与HTML。它被设计的宗旨就是描述数据,而非显示数据。
  • XML标签没有被预定义,需要用户自定定义标签。
  • XML技术是W3C组织发布的。目前遵循的规范是1.0规范。
  • XML被广泛认为是继java之后在Internet上最激动人心的新技术。

2 XML技术能够解决什么问题?

  • XML语言出现的根本目的就是在于描述数据。
  • XML是一种通用的数据交换格式。
  • 在XML语言中,允许yoghurt自定义标签。一个标签用于描述一段数据,一个标签有开始标签和结束表现,在开始标签和结束标签之间,又可以使用其它标签描述其它数据,所以XML可以实现数据关系的描述。
  • XML中的数据必须通过软件程序来解析和显示,这样的解析程序称为Parser解析器。

3 XML的常见应用

  • 在java开发中,传统的配置文件是*.properties文件,而XML表示的数据更为丰富。
  • XML技术除了用于描述有关系的数据外,还经常用于软件的配置文件,以描述程序模块之间的关系。
  • 在一个软件系统中,通过XML配置文件可提供系统的灵活度,即程序的行为是通过XML文件来配置的,而不是硬编码。

4 XML的文档声明

  • 在编写XML的时候,需要先使用文档声明来声明XML文档,且必须在第一行。
  • 最简单的语法:<?xml version="1.0"?>
  • 用encoding属性说明文件所使用的字符编码。

5 元素

  • XML元素是指XML文件中出现的标签。一个标签分为起始和结束标签。
  • 一个标签有若干个子标签,但所有标签必须合理的嵌套,不允许交叉嵌套。
  • 一个XML文档必须有且仅有一个根标签,其他标签都是这个根标签的子标签或后代标签。
  • XML中不会忽略主题内容中出现的空格和换行。
  • 元素的名称可以包含字母、数字、减号、下划线和英文句点,但必须遵守下面的一些规范:
    • 严格区分大小写
    • 只能以字母或下划线开头
    • 不能以XML或xml开头
    • 名车字符之间不能有空格或制表符
    • 名称字符之间不能使用冒号  

6 属性

  • 一个元素可以有多个属性,每个属性都有它自己的名称和取值。
  • 属性值一定要用引号引起来。
  • 属性名称的命名规范和元素的命名规范相同。
  • 元素中的属性是不允许重复的。
  • 在XML技术中,标签属性所代表的信息也可以被改为子元素的形式描述。

7 注释

  • XML中的注释语法为:<!-- 这是注释 -->
  • 注意:
    • XML声明之前不能有注释。
    • 注释不能嵌套。  

8 特殊字符

特殊字符 替代符号
& &amp;
< &lt;
> &gt;
" &quot;
' &apos;

9 XML约束

9.1 为什么需要约束

  • XML都是用户自定义的标签,如果出现小小的错误,软件程序将不能正确的获取文件中的内容而报错。
  • XML技术中,可以编写一个文档来约束一个XML的书写规范,这个文档被称之为约束。
  • 格式良好的XML:遵循XML语法的XML。
  • 有效的XML:遵循约束文档的XML。
  • 总之:
    • 约束文档定义了在XML中允许出现的元素名称、属性和元素出现的顺序等等。  

9.2 常用的约束技术

  • DTD
  • Schema

9.3 DTD

  • DTD:Document Type  Definition:文档类型定义。
  • 作用:约束XML的书写规范。
  • DTD文件的扩展名是.dtd

9.4 编写DTD的方式

9.4.1 直接打dtd的内容放在XML文件中

  • 示例:
<?xml version='1.0' encoding='UTF-8'?>
<!DOCTYPE 书架 [
    <!ELEMENT 书架 (书+)>
    <!ELEMENT 书 (书名,作者,售价)>
    <!ELEMENT 书名 (#PCDATA)>
    <!ELEMENT 作者 (#PCDATA)>
    <!ELEMENT 售价 (#PCDATA)>
]>
<书架>
    <书>
        <书名>java从入门到放弃</书名>
        <作者>你好</作者>
        <售价>0.01</售价>
    </书>
    <书>
        <书名>c从入门到精通</书名>
        <作者>我好</作者>
        <售价>1.00</售价>
    </书>
</书架>

9.4.2 dtd作为单独的文件存在

  • book.dtd
<!ELEMENT 书架 (书+)>
<!ELEMENT 书 (书名,作者,售价)>
<!ELEMENT 书名 (#PCDATA)>
<!ELEMENT 作者 (#PCDATA)>
<!ELEMENT 售价 (#PCDATA)>
  • book.xml
<?xml version='1.0' encoding='UTF-8'?>
<!DOCTYPE 书架 SYSTEM "book.dtd" >
<书架>
    <书>
        <书名>java从入门到放弃</书名>
        <作者>你好</作者>
        <售价>0.01</售价>
    </书>
    <书>
        <书名>c从入门到精通</书名>
        <作者>我好</作者>
        <售价>1.00</售价>
    </书>
</书架>

10 XML 的解析方式

  • DOM
  • SAX

11 java解析XML概述

  • JAXP:开发包是JavaSE的一部分,它是由以下三个部分组成的:

    • org.w3c.dom:提供DOM方式解析XML的标准接口
    • org.xml.sax:提供SAX方式解析XML的标准接口
    • javax.xml:提供了解析XML文档的类  
  • XML的解析开发包

    • JAXP:是sun公司推出的解析标准实现。
    • Dom4j:是开源组织推出的解析开发工具包。  

12 使用JAXP进行DOM解析

  • javax.xml.parsers包中的DocumentBuilderFactory用于创建DOM模式的解析器对象,DocumentBuilderFactory是一个抽象工厂类,它不能直接实例化,但该类提供了一个newInstance()方法,这个方法会根据本地平台默认安装的解析器,自动创建一个工厂的对象并返回。
  • 获取JAXP中的DOM解析器

    • ①调用DocumentBuilderFactory.newInstance()方法得到创建DOM解析器的工厂。
    • ②调用工厂对象的newDocumentBuilder()方法得到DOM解析器对象。
    • ③调用DOM解析器对象的parse()方法解析XML文档,得到代表整个文档的Document对象,这样就可以利用DOM特性对这个XML文档进行操作了。  
  • 示例:读取所有节点的名称
<?xml version='1.0' encoding='UTF-8'?>
<书架>
    <书>
        <书名>java从入门到放弃</书名>
        <作者>你好</作者>
        <售价>0.01</售价>
    </书>
    <书>
        <书名>c从入门到精通</书名>
        <作者>我好</作者>
        <售价>1.00</售价>
    </书>
</书架>
package com;

import org.w3c.dom.Document;
import org.w3c.dom.Element;
import org.w3c.dom.Node;
import org.w3c.dom.NodeList;
import org.xml.sax.SAXException;

import javax.xml.parsers.DocumentBuilder;
import javax.xml.parsers.DocumentBuilderFactory;
import javax.xml.parsers.ParserConfigurationException;
import java.io.File;
import java.io.IOException;

/**
 * 2017/10/28
 * 说明:
 */
public class JAXPDemo {
    public static void main(String[] args) throws ParserConfigurationException, IOException, SAXException {
        /*
        * 通过DocumentBuilderFactory获取解析器工厂
        */
        DocumentBuilderFactory builderFactory = DocumentBuilderFactory.newInstance();
        /**
         * 通过解析器工厂获取解析器
         */
        DocumentBuilder builder = builderFactory.newDocumentBuilder();
        /**
         * 解析器解析xml获取document对象
         */
        Document document =  builder.parse(new File("D:\\code\\web\\src\\main\\webapp\\book.xml"));

        Node book =  document.getElementsByTagName("书架").item(0);

        if(book.getNodeType() == Node.ELEMENT_NODE){
            Element e = (Element) book;

            getNode(e);

        }

    }

    private static void getNode(Node d) {
        if(d.getNodeType() == Node.ELEMENT_NODE){
            System.out.print(d.getNodeName()+"\n");
        }
        NodeList childNodes = d.getChildNodes();
        for(int x = 0;x<childNodes.getLength();x++){
            Node node = childNodes.item(x);
            getNode(node);
        }

    }
}
  • 示例:将书名是java从入门到放弃的作者改为呵呵
<?xml version='1.0' encoding='UTF-8'?>
<书架>
<书>
    <书名>java从入门到放弃</书名>
    <作者>你好</作者>
    <售价>0.01</售价>
</书>
<书>
    <书名>c从入门到精通</书名>
    <作者>我好</作者>
    <售价>1.00</售价>
</书>
</书架>
package com;

import javafx.scene.transform.Transform;
import org.w3c.dom.Document;
import org.w3c.dom.Element;
import org.w3c.dom.Node;
import org.w3c.dom.NodeList;
import org.xml.sax.SAXException;

import javax.xml.parsers.DocumentBuilder;
import javax.xml.parsers.DocumentBuilderFactory;
import javax.xml.parsers.ParserConfigurationException;
import javax.xml.transform.Transformer;
import javax.xml.transform.TransformerConfigurationException;
import javax.xml.transform.TransformerException;
import javax.xml.transform.TransformerFactory;
import javax.xml.transform.dom.DOMSource;
import javax.xml.transform.stream.StreamResult;
import java.io.File;
import java.io.FileOutputStream;
import java.io.IOException;

/**
 * 2017/10/28
 * 说明:
 */
public class JAXPDemo {
    public static void main(String[] args) throws ParserConfigurationException, IOException, SAXException, TransformerException {
        /*
        * 通过DocumentBuilderFactory获取解析器工厂
        */
        DocumentBuilderFactory builderFactory = DocumentBuilderFactory.newInstance();
        /**
         * 通过解析器工厂获取解析器
         */
        DocumentBuilder builder = builderFactory.newDocumentBuilder();
        /**
         * 解析器解析xml获取document对象
         */
        Document document =  builder.parse(new File("D:\\code\\web\\src\\main\\webapp\\book.xml"));

        Node authorNode  = document.getElementsByTagName("作者").item(0);

        if(authorNode.getNodeType() == Node.ELEMENT_NODE){
            Element authorElement = (Element) authorNode;

            authorElement.setTextContent("呵呵");
        }

        TransformerFactory transformerFactory = TransformerFactory.newInstance();

        Transformer transformer = transformerFactory.newTransformer();

        transformer.transform(new DOMSource(document),new StreamResult(new FileOutputStream("D:\\code\\web\\src\\main\\webapp\\book.xml")));

    }

}

XML (一)的更多相关文章

  1. XStream将java对象转换为xml时,对象字段中的下划线“_”,转换后变成了两个的解决办法

            在前几天的一个项目中,由于数据库字段的命名原因 其中有两项:一项叫做"市场价格"一项叫做"商店价格" 为了便于区分,遂分别将其命名为market ...

  2. .NET Core采用的全新配置系统[9]: 为什么针对XML的支持不够好?如何改进?

    物理文件是我们最常用到的原始配置的载体,最佳的配置文件格式主要由三种,它们分别是JSON.XML和INI,对应的配置源类型分别是JsonConfigurationSource.XmlConfigura ...

  3. WebApi接口 - 响应输出xml和json

    格式化数据这东西,主要看需要的运用场景,今天和大家分享的是webapi格式化数据,这里面的例子主要是输出json和xml的格式数据,测试用例很接近实际常用情况:希望大家喜欢,也希望各位多多扫码支持和点 ...

  4. XML技术之DOM4J解析器

    由于DOM技术的解析,存在很多缺陷,比如内存溢出,解析速度慢等问题,所以就出现了DOM4J解析技术,DOM4J技术的出现大大改进了DOM解析技术的缺陷. 使用DOM4J技术解析XML文件的步骤? pu ...

  5. UWP开发之Mvvmlight实践六:MissingMetadataException解决办法(.Net Native下Default.rd.xml配置问题)

    最近完成一款UWP应用,在手机端测试发布版(Release)的时候应用莫名奇妙的强行关闭,而同样的应用包在PC端一点问题都没有,而且Debug版在两个平台都没有问题,唯独手机的Release版有问题. ...

  6. PHP中遍历XML之SimpleXML

    简单来讲述一些XML吧,XML是可扩展标记语言,是一种用于标记电子文件使其具有结构性的标记语言.XML是当今用于传输数据的两大工具之一,另外一个是json. 我们在PHP中使用XML也是用来传输数据, ...

  7. Asp.Net 操作XML文件的增删改查 利用GridView

    不废话,直接上如何利用Asp.NET操作XML文件,并对其属性进行修改,刚开始的时候,是打算使用JS来控制生成XML文件的,但是最后却是无法创建文件,读取文件则没有使用了 index.aspx 文件 ...

  8. Mybatis XML配置

    Mybatis常用带有禁用缓存的XML配置 <?xml version="1.0" encoding="UTF-8" ?> <!DOCTYPE ...

  9. Drawable实战解析:Android XML shape 标签使用详解(apk瘦身,减少内存好帮手)

    Android XML shape 标签使用详解   一个android开发者肯定懂得使用 xml 定义一个 Drawable,比如定义一个 rect 或者 circle 作为一个 View 的背景. ...

  10. C#反序列化XML异常:在 XML文档(0, 0)中有一个错误“缺少根元素”

    Q: 在反序列化 Xml 字符串为 Xml 对象时,抛出如下异常. 即在 XML文档(0, 0)中有一个错误:缺少根元素. A: 首先看下代码: StringBuilder sb = new Stri ...

随机推荐

  1. 安装cocoapods遇到的问题

    1.终端报下面的错误 ERROR:  While executing gem ... (Errno::EPERM) Operation not permitted - /usr/bin/pod 解决方 ...

  2. [转]python变量作用域的有趣差别

    func()里 可以访问全局变量i,但不能给i重新赋值. i = 1 def func(): print( i + 1) func() # 2 用global声明后,可以给i重新赋值. i = 1 d ...

  3. 大话命令之--ss

    大话命令之-ss ss是Socket Statistics的缩写.顾名思义,ss命令可以用来获取socket统计信息,它可以显示和netstat类似的内容. 优势: (1)显示更多更详细的有关TCP和 ...

  4. 【Java】静态代码块使用

    一.java静态代码块与静态方法区别一般情况下,如果有些代码必须在项目启动的时候就执行的时候,需要使用静态代码块,这种代码是主动执行的;需要在项目启动的时候就初始化,在不创建对象的情况下,其他程序来调 ...

  5. React Native:真机断点调试+跨域资源加载出错问题解决

    写在前面 闲来无事,折腾了一下React Native,相比之前,开发体验好了不少.但在真机断点调试那里遇到了跨域资源加载出错的问题,一番探索总算解决,目测是RN新版本调试服务的bug. 遇到类似问题 ...

  6. linux几条常用的命令

    列出一些手头分分钟要用到的命令. 1.df -h 用来查看各个分区的大小 2.du -h --max-depth=0 /data2/xijun.gong/tt_data 用来查看文件夹的大小,并指定递 ...

  7. python 序列话模块 常用

    什么是序列化? 我们把对象(变量)从内存中变成可存储或传输的过程称之为序列化,在Python中叫pickling,在其他语言中也被称之为serialization,marshalling,flatte ...

  8. CTF---Web入门第十二题 程序逻辑问题

    程序逻辑问题分值:20 来源: 实验吧 难度:中 参与人数:6909人 Get Flag:1993人 答题人数:2070人 解题通过率:96% 绕过 解题链接: http://ctf5.shiyanb ...

  9. [51nod1410]回文调整

    给一个序列,选择其中一个区间,这个区间内的数字顺序可以随意互换.问有多少这样的选择使得整个序列(不是选择的区间)是一个回文. 说明:为了要使得整个序列是一个回文,可以选择一个区间对里面的数字进行调整, ...

  10. BZOJ 1257: [CQOI2007]余数之和sum【神奇的做法,思维题】

    1257: [CQOI2007]余数之和sum Time Limit: 5 Sec  Memory Limit: 162 MBSubmit: 4474  Solved: 2083[Submit][St ...