什么是XML?

XML是可拓展标记语言,它和XHTML很像、但它和XHTML的目的性不一样,XHTML负责展示数据,而XML负责保存或交换传输数据。

而且XML可拓展,它没有固定的标签、它的标签可以自定义。

功能

  1. 数据存储。(可作为小型数据库,配置文件)
  2. 数据传输、交换。(ajax,web服务:天气查询,电话号码归属地查询等)

结构

XML是树形结构,必须拥有一个根节点:

<?xml version="1.0" encoding="UTF-8"?>
<books>
    <book number="0593">
        <name>1984</name>
        <category>文学</category>
    </book>
    <book number="1578">
        <name>史记</name>
        <category>历史</category>
    </book>
    <book number="5493">
        <name>西西弗神话</name>
        <category>哲学</category>
    </book>
</books>

注:根节点必须且只有一个,XML的节点有三种:元素,属性,文本。

实体引用

当我们编写含有特殊符号的文本时需要用到实体转移:

  • &lt:         <
  • &gt:        >
  • &amp:     &
  • &apos:    '
  • quot:      "

当文本含有过多的特殊符号时 可以使用CDATA处理:

<?xml version="1.0" encoding="UTF-8"?>
<root>
    <some_string>
        <![CDATA[
        slie'se'f'd"sa"<>fe &&&&&
        ]]>
    </some_string>
</root>

DTD

DTD是用来规范XML的,XML是可拓展的标记语言,元素可以随意编写 所以我们需要一种机制来约束或者说规范XML文档,特别是在传输数据时。

验证网站:http://validator.w3.org

元素定义

<!ELEMENT 元素名 元素内容模型>

我们需要处理5种元素:

  • 仅仅包含元素的元素
  • 仅仅包含文本的元素
  • 包含文本和元素的混合元素
  • 空元素
  • 任意元素

我们以后会经常使用的符号:

  1. EMPTY              代表元素为空           <!ELEMENT 元素名 EMPTY>
  2. ANY                  代表任何内容           <!ELEMENT 元素名 ANY>
  3. (#PCDATA)       代表之包含文本     <!ELEMENT 元素名 (#PCDATA)>
  4. ()                     代表要包含的子元素  <!ELEMENT 元素名 (子元素)>
  5. ,                      代表子元素的顺序      <!ELEMENT 元素名 (子元素1,子元素2,…………)>          如果使用顺序符号,那么编写XML时子元素的顺序必须按照DTD的顺序编写
  6. |                      代表或                    <!ELEMENT 元素名 (子元素1|子元素2)>                    或的意思是 两个子元素必须二选一 且必须出现
  7. +                     代表至少出现一次      <!ELEMENT 元素名 (子元素1+)>                             子元素1至少出现一次
  8. *                     代表可0或任意次数     <!ELEMENT 元素名 (子元素1*)>                             子元素1可不出现,也可出现多次
  9. ?                     代表出现0或1次         <!ELEMENT 元素名 (子元素1?)>                              子元素1可不出现,或只能出现一次
<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE books[
    <!ELEMENT books (book+)>
    <!ELEMENT book (name,category)>
    <!ELEMENT name (#PCDATA)>
    <!ELEMENT category (#PCDATA)>
]>

<books>
    <book>
        <name>1984</name>
        <category>文学</category>
    </book>
    <book>
        <name>史记</name>
        <category>历史</category>
    </book>
    <book>
        <name>西西弗神话</name>
        <category>哲学</category>
    </book>
</books>

包含混合元素:

<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE books[
    <!ELEMENT books (book+)>
    <!ELEMENT book (name,category)>
    <!ELEMENT name (#PCDATA)>
    <!ELEMENT category (#PCDATA|some_element)*>
    <!ELEMENT some_element (#PCDATA)>
]>

<books>
    <book>
        <name>1984</name>
        <category>文<some_element>sliejfj</some_element>学</category>
    </book>
    <book>
        <name>史记</name>
        <category>历史</category>
    </book>
    <book>
        <name>西西弗神话</name>
        <category>哲学</category>
    </book>
</books>

属性定义

格式:<!ATTLIST 元素名 属性名 属性值类型 取值方式>

属性值类型:

  • CDATA:字符类型。
  • (en1,en2....):枚举中的一个。
  • ID:值是唯一的ID,只允许出现一次。
  • IDREF:值是另一个元素的ID。
  • IDREFS:值为其他ID列表。
  • NMTOKEN:值为合法的XML名称。
  • NMTOKENS:值为合法的XML名称列表。
  • ENTITY:值为一个实体。
  • ENTITIES:实体列表。
  • NOTATION:符号的名称。
  • xml:值是预定义的xml值。

取值方式:

  • REQUIRED:属性值是必须的。
  • IMPLIED:属性值不是必须的。
  • FIXED value:属性值是固定的,如果没有声明 则默认是这个值,如果声明了 那只能写这个值。

例子1:

<?xml version="1.0" encoding="UTF-8"?>

<!DOCTYPE books[
    <!ELEMENT books (book+)>
    <!ELEMENT book (name)>
    <!ELEMENT name (#PCDATA)>
    <!ATTLIST book category CDATA #REQUIRED>
    <!ATTLIST name order CDATA #IMPLIED>
]>

<books>
    <book category='工具书'>
        <name order='0'>PHP经典实例</name>
    </book>

    <book category='历史'>
        <name>三国志</name>
    </book>
</books>

例子2:

<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE books[
    <!ELEMENT books (book)*>
    <!ELEMENT book (name)>
    <!ELEMENT name (#PCDATA)>
    <!ATTLIST name lang (en|zh) #IMPLIED>
]>

<books>
    <book>
        <name lang='en'>ThinkPHP</name>
    </book>
</books>

例子3:默认值写法,如果没有声明用默认值,如果声明了 则覆盖默认值。

<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE books[
    <!ELEMENT books (book)*>
    <!ELEMENT book (name)>
    <!ELEMENT name (#PCDATA)>
    <!ATTLIST name lang (en|zh) 'zh'>
]>

<books>
    <book>
        <name lang='en'>ThinkPHP</name>
    </book>
</books>

例子4:一个元素含有多个属性

<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE books[
    <!ELEMENT books (book)*>
    <!ELEMENT book (name)>
    <!ELEMENT name (#PCDATA)>
    <!ATTLIST name lang (en|zh) #REQUIRED
                    id ID #REQUIRED>
]>

<books>
    <book>
        <name lang='en' id='q1'>ThinkPHP</name>
    </book>
</books>

我的PHP之旅--XML初步的更多相关文章

  1. 我的PHP之旅--XML操作

    XML操作 XML主要是做数据存储和WEB服务的,所以我们难免要操作它,这里只介绍PHP的simpleXML方式. 我们要操作的XML: <?xml version="1.0" ...

  2. LINQ TO XML初步了解

    最近简单的学习了一下LINT TO XML,写篇博客在这,方便以后查看~~ 1.常用到的类   XmlDocument --    文档(xml文件)     XmlElement    --     ...

  3. xml 初步学习 读取

    引入xml文件    function loadXMLDoc(dname) {         if (window.XMLHttpRequest) {             xhttp = new ...

  4. xml初步,DTD和Schema约束

    XML 可扩展的标记语言(!!!可扩展) 作用 1.存放数据 2.配置文件 语法 文档声明 <?xml version="1.0" encoding="UTF-8& ...

  5. LinQ实战学习笔记(一) LINQ to (Objects, XML, SQL) 入门初步

    LINQ对于笔者来说, 优美而浓缩的代码让人震惊. 研究LINQ就是在艺术化自己的代码. 之前只是走马观花学会了基本的语法, 但是经常在CSDN看到令人惊讶自叹不如的LINQ代码, 还是让人羡慕嫉妒恨 ...

  6. Java学习笔记(十三一)——Xml 常用知识总结

    [前面的话] 在学习spring框架,发现很多地方都用到了Xml的知识,所以会过头来再学习学习Xml. 本章学习的是Xml的基础,所以基础性文章,选择性阅读. [Xml] 一.Xml初步了解 XML ...

  7. Python爬取CSDN博客文章

    0 url :http://blog.csdn.net/youyou1543724847/article/details/52818339Redis一点基础的东西目录 1.基础底层数据结构 2.win ...

  8. 新一代编程:scala泛函编程技术-唠叨

    准备了半年后,终于决定在这里开始我的scala编程技术学习体验撰写之旅.初步打算在这里把我学习.体验.掌握scala编程的过程与有兴趣的朋友分享.我想,虽然我这不是正式论文或者教课书之类的,但写个开场 ...

  9. Android自动化初探:ADB

    Info:经过一段时间的准备,从今天开始自学Android之旅,初步学习会有疏漏,以后的每篇文章,我都会不断修改补全,直到完美. 2014-10-09:初版 --------------------- ...

随机推荐

  1. 【策略】UVa 11389 - The Bus Driver Problem

    题意: 有司机,下午路线,晚上路线各n个.给每个司机恰好分配一个下午路线和晚上路线.给出行驶每条路线的时间,如果司机开车时间超过d,则要付加班费d×r.问如何分配路线才能使加班费最少. 虽然代码看起来 ...

  2. AngularJS合集

    AngularJS是Google开源的一款JavaScript MVC框架,弥补了HTML在构建应用方面的不足,其通过使用指令(directives)结构来扩展HTML词汇,使开发者可以使用HTML来 ...

  3. echars3.0 柱状图大小设置

    { name:'百度', type:'bar', barWidth : 10, stack: '搜索引擎', data:[620, 732, 701, 734, 1090, 1130, 1120] } ...

  4. Ehcache(2.9.x) - API Developer Guide, Write-Through and Write-Behind Caches

    About Write-Through and Write-Behind Caches Write-through caching is a caching pattern where writes ...

  5. Nginx - Additional Modules, Content and Encoding

    The following set of modules provides functionalities having an effect on the contents served to the ...

  6. C#几个经常犯错误汇总

    在我们平常编程中,时间久了有时候会形成一种习惯性的思维方式,形成固有的编程风格,但是有些地方是需要斟酌的,即使是一个很小的错误也可能会导致昂贵的代价,要学会善于总结,从错误中汲取教训,尽量不再犯同样错 ...

  7. android opencv 人脸检测

    转载自http://blog.csdn.net/jesse__zhong/article/details/24889709 .......省略包 public class Staticdetectio ...

  8. ArcMap 10.2 crashes during Loading Document launch stage

    问题描述: ArcMap unexpectedly exits during the "Loading Document..." stage on startup. No erro ...

  9. SQL之存储过程,仿数组

    create procedure update_ERPTreeList(@s1 varchar(),@s2 varchar()) As Begin declare @ss1 varchar(),@ss ...

  10. C# 添加,修改,删除文件夹/文件集合

    C#追加文件 StreamWriter sw = File.AppendText(Server.MapPath(".")+"\\myText.txt"); sw ...