一、XML Expat解析器

内建的Expat解析器使在PHP中处理XML文档成为可能。

XML用于描述数据,其焦点是数据是什么。XML 文件描述了数据的结构。

在XML中,没有预定义的标签。您必须定义自己的标签。

如需读取和更新 - 创建并处理 - 一个XML文档,您需要XML解析器。

两种基本的XML解析器类型:
1.基于树的解析器:这种解析器把XML文档转换为树型结构。它分析整篇文档,并提供了API来访问树种的元素,例如文档对象模型(DOM)。
2.基于事件的解析器:将XML文档视为一系列的事件。当某个具体的事件发生时,解析器会调用函数来处理。

Expat解析器是基于事件的解析器。

基于事件的解析器集中在XML文档的内容,而不是它们的结果。正因如此,基于事件的解析器能够比基于树的解析器更快地访问数据。

请看下面的 XML 片段:
<from>John</from>
基于事件的解析器把上面的 XML 报告为一连串的三个事件:
开始元素:from
开始 CDATA 部分, 值:John
关闭元素: from

上面的 XML 范例包含了形式良好的 XML。不过这个例子是无效的 XML,因为没有与它关联的文档类型声明 (DTD),也没有内嵌的 DTD。
不过,在使用 Expat 解析器时,这没有区别。Expat 是不检查有效性的解析器,忽略任何 DTD。
作为一款基于事件、非验证的 XML 解析器,Expat 快速且轻巧,十分适合 PHP 的 web 应用程序。
注释:XML 文档必须形式良好,否则 Expat 会生成错误。

XML Expat 解析器是PHP核心的组成部分。无需安装就可以使用这些函数。

XML文件
将在我们的例子中使用下面的 XML 文件:

<?xml version="1.0" encoding="ISO-8859-1"?>
<note>
<to>George</to>
<from>John</from>
<heading>Reminder</heading>
<body>Don't forget the meeting!</body>
</note>

初始化XML解析器
我们要在PHP中初始化XML解析器,为不同的XML事件定义处理器,然后解析这个XML 文件。

<?php

//Initialize the XML parser
$parser=xml_parser_create(); //Function to use at the start of an element
function start($parser,$element_name,$element_attrs)
{
switch($element_name)
{
case "NOTE":
echo "-- Note --<br />";
break;
case "TO":
echo "To: ";
break;
case "FROM":
echo "From: ";
break;
case "HEADING":
echo "Heading: ";
break;
case "BODY":
echo "Message: ";
}
} //Function to use at the end of an element
function stop($parser,$element_name)
{
echo "<br />";
} //Function to use when finding character data
function char($parser,$data)
{
echo $data;
} //Specify element handler
xml_set_element_handler($parser,"start","stop"); //Specify data handler
xml_set_character_data_handler($parser,"char"); //Open XML file
$fp=fopen("test.xml","r"); //Read data
while ($data=fread($fp,4096))
{
xml_parse($parser,$data,feof($fp)) or
die (sprintf("XML Error: %s at line %d",
xml_error_string(xml_get_error_code($parser)),
xml_get_current_line_number($parser)));
} //Free the XML parser
xml_parser_free($parser); ?>

以上代码的输出:

-- Note --
To: George
From: John
Heading: Reminder
Message: Don't forget the meeting!

工作原理解释:
通过 xml_parser_create()函数初始化XML解析器
创建配合不同事件处理程序的的函数
添加xml_set_element_handler()函数来定义,当解析器遇到开始和结束标签时执行哪个函数
添加xml_set_character_data_handler()函数来定义,当解析器遇到字符数据时执行哪个函数
通过xml_parse()函数来解析文件"test.xml"
万一有错误的话,添加 xml_error_string()函数把XML错误转换为文本说明
调用xml_parser_free()函数来释放分配给xml_parser_create()函数的内存

二、XML DOM
内建的DOM解析器使在PHP中处理XML文档成为可能。

W3C DOM 被分为不同的部分 (Core, XML 和 HTML) 和不同的级别 (DOM Level 1/2/3):
Core DOM - 为任何结构化文档定义标准的对象集
XML DOM - 为 XML 文档定义标准的对象集
HTML DOM - 为 HTML 文档定义标准的对象集

DOM解析器是基于树的解析器。

请看下面的XML文档片段:

<?xml version="1.0" encoding="ISO-8859-1"?>
<from>John</from>

XML DOM 把 XML 视为一个树形结构:
Level 1: XML 文档
Level 2: 根元素: <from>
Level 3: 文本元素: "John"

DOM XML 解析器函数是 PHP 核心的组成部分。无需安装就可以使用这些函数。

XML 文件
将在我们的例子中使用下面的 XML 文件:

<?xml version="1.0" encoding="ISO-8859-1"?>
<note>
<to>George</to>
<from>John</from>
<heading>Reminder</heading>
<body>Don't forget the meeting!</body>
</note>

加载和输出 XML
我们需要初始化 XML 解析器,加载 XML,并把它输出:
例子

<?php
$xmlDoc = new DOMDocument();
$xmlDoc->load("note.xml"); print $xmlDoc->saveXML();
?>

以上代码的输出:

George John Reminder Don't forget the meeting!

假如您在浏览器窗口中查看源代码,会看到下面这些 HTML:

<?xml version="1.0" encoding="ISO-8859-1"?>
<note>
<to>George</to>
<from>John</from>
<heading>Reminder</heading>
<body>Don't forget the meeting!</body>
</note>

上面的例子创建了一个 DOMDocument-Object,并把 "note.xml" 中的 XML 载入这个文档对象中。
saveXML() 函数把内部 XML 文档放入一个字符串,这样我们就可以输出它。

循环XML
我们要初始化 XML 解析器,加载 XML,并循环 <note> 元素的所有元素:
例子

<?php
$xmlDoc = new DOMDocument();
$xmlDoc->load("note.xml"); $x = $xmlDoc->documentElement;
foreach ($x->childNodes AS $item)
{
print $item->nodeName . " = " . $item->nodeValue . "<br />";
}
?>

以上代码的输出:

#text =
to = George
#text =
from = John
#text =
heading = Reminder
#text =
body = Don't forget the meeting!
#text =

在上面的例子中,您看到了每个元素之间存在空的文本节点。
当 XML 生成时,它通常会在节点之间包含空白。XML DOM 解析器把它们当作普通的元素,如果您不注意它们,有时会产生问题。

三、SimpleXML
SimpleXML处理最普通的XML任务,其余的任务则交由其它扩展。

SimpleXML是PHP5中的新特性。在了解XML文档 layout的情况下,它是一种取得元素属性和文本的便利途径。

与DOM或Expat解析器相比,SimpleXML 仅仅用几行代码就可以从元素中读取文本数据。

SimpleXML可把 XML文档转换为对象,比如:
元素 - 被转换为 SimpleXMLElement对象的单一属性。当同一级别上存在多个元素时,它们会被置于数组中。
属性 - 通过使用关联数组进行访问,其中的下标对应属性名称。
元素数据 - 来自元素的文本数据被转换为字符串。如果一个元素拥有多个文本节点,则按照它们被找到的顺序进行排列。

当执行类似下列的基础任务时,SimpleXML 使用起来非常快捷:
读取 XML 文件
从 XML 字符串中提取数据
编辑文本节点或属性

不过,在处理高级 XML 时,比如命名空间,最好使用 Expat 解析器或 XML DOM。

安装
从 PHP 5.0 开始,SimpleXML 函数是 PHP 核心的组成部分。无需安装就可以使用这些函数。

使用SimpleXML
下面是 XML 文件:

<?xml version="1.0" encoding="ISO-8859-1"?>
<note>
<to>George</to>
<from>John</from>
<heading>Reminder</heading>
<body>Don't forget the meeting!</body>
</note>

我们打算从上面的XML文件输出元素的名称和数据。

这是需要做的事情:
加载 XML 文件
取得第一个元素的名称
使用 children() 函数创建在每个子节点上触发的循环
输出每个子节点的元素名称和数据

例子

<?php
$xml = simplexml_load_file("test.xml"); echo $xml->getName() . "<br />"; foreach($xml->children() as $child)
{
echo $child->getName() . ": " . $child . "<br />";
}
?>

以上代码的输出:

note
to: George
from: John
heading: Reminder
body: Don't forget the meeting!

PHP XML笔记汇总的更多相关文章

  1. SpringBoot+MyBatis练手项目笔记汇总

    以下是我在练习SpringBoot+MyBatis训练时候个人一些笔记汇总(可以点击跳转),献丑了,网上很多大佬的文章都比我写的详细,一些好的文章,我会将贴到各个内容中. 1. 插入数据返回id和内部 ...

  2. 读书笔记汇总 - SQL必知必会(第4版)

    本系列记录并分享学习SQL的过程,主要内容为SQL的基础概念及练习过程. 书目信息 中文名:<SQL必知必会(第4版)> 英文名:<Sams Teach Yourself SQL i ...

  3. MySQL笔记汇总

    [目录] MySQL笔记汇总 一.mysql简介 数据简介 结构化查询语言 二.mysql命令行操作 三.数据库(表)更改 表相关 字段相关 索引相关 表引擎操作 四.数据库类型 数字型 字符串型 日 ...

  4. NGUI学习笔记汇总

    NGUI学习笔记汇总,适用于NGUI2.x,NGUI3.x 一.NGUI的直接用法 1. Attach a Collider:表示为NGUI的某些物体添加碰撞器,如果界面是用NGUI做的,只能这样添加 ...

  5. 读书笔记汇总 --- 用Python写网络爬虫

    本系列记录并分享:学习利用Python写网络爬虫的过程. 书目信息 Link 书名: 用Python写网络爬虫 作者: [澳]理查德 劳森(Richard Lawson) 原版名称: web scra ...

  6. ST官方翻译的中文应用笔记汇总

    ST官方翻译的中文应用笔记汇总 http://www.51hei.com/stm32/3382.html 官方中文AN:AN3116:STM32? 的 ADC 模式及其应用AN1015:用于提高微控制 ...

  7. Spring研磨分析、Quartz任务调度、Hibernate深入浅出系列文章笔记汇总

    Spring研磨分析.Quartz任务调度.Hibernate深入浅出系列文章笔记汇总 置顶2017年04月27日 10:46:45 阅读数:1213 这系列文章主要是对Spring.Quartz.H ...

  8. ES6 笔记汇总

    ES6 笔记汇总 二.ES6基础-let和const命令 三.变量的解构赋值 四.字符串的拓展 五.正则表达式的拓展 ...将会持续更新,敬请期待

  9. 【笔记目录2】【jessetalk 】ASP.NET Core快速入门_学习笔记汇总

    当前标签: ASP.NET Core快速入门 共2页: 上一页 1 2  任务27:Middleware管道介绍 GASA 2019-02-12 20:07 阅读:15 评论:0 任务26:dotne ...

随机推荐

  1. Wex5案例使用JSON传输Thinkphp后端对接,以达成数据正常输出

    初步接触Wex5,操作起来还是觉得比较复杂!而且教程不多,让我着实比较烦躁! 因此自己动手丰衣足食!还是比较实在的! 采用版本:WeX5应用快速开发框架V3.5正式版 我们使用Wex5的仿淘宝APP案 ...

  2. Servlet中的配置 web.xml

    url-pattern配置 可以为同一个Servlet配置多个url-pattern: <servlet> <servlet-name>DoGetPostDemo</se ...

  3. TFS 2010 配置的时候,提示TF255466错误

    TFS 2010 配置的时候,提示TF255466错误 Error [ System Checks ] TF255466: The configuration process for Team Fou ...

  4. 九度OJ1468

    这道题其实就是个很简单的静态链表,需要注意的是,地址一共有5位,最后输出的时候如果之前是使用int类型存储地址的话,一定要强制规定输出的位数(5位),否则有可能会将高位省略.(如地址00001输出为1 ...

  5. FreeMarker语法知识

    FreeMarker的模板文件并不比HTML页面复杂多少,FreeMarker模板文件主要由如下4个部分组成:1,文本:直接输出的部分2,注释:<#-- ... -->格式部分,不会输出3 ...

  6. sql server 2008 System.Data.SqlClient.SqlException (0x80131904): 查询处理器未能为执行并行查询启动必要的线程资源 处理方法

    修改并行度: 修改了这个“最大并行度”,如果再没出现 cxpacket应该没问题了 参考资料:http://jingyan.baidu.com/article/5d6edee22daf8799eade ...

  7. JavaScript学习笔记---入门

    1.JavaScript 语句和 JavaScript 变量都对大小写敏感. 2.重新声明 JavaScript 变量 如果重新声明 JavaScript 变量,该变量的值不会丢失: 在以下两条语句执 ...

  8. Mplayer 官方中文手册

    MPlayer 名称总览描述交互式控制用法配置文件配置集通用选项播放器选项(仅适用于MPLAYER)分离器/媒体流选项OSD/字幕选项音频输出选项(仅适用于MPLAYER)音频输出驱动(仅适用于MPL ...

  9. unix环境C编程之日期时间转换

    1.理清概念 1.1.日历时间:   含义:国际标准时间1970年1月1日00:00:00以来经过的秒数.   数据类型:time_t.实际上是long的别名. 1.2.tm结构时间:   含义:结构 ...

  10. OC基础(25)

    NSNumber NSValue NSDate NSFileManager *:first-child { margin-top: 0 !important; } body > *:last-c ...