雷林鹏分享：Ruby XML, XSLT 和 XPath 教程

　　Ruby XML, XSLT 和 XPath 教程

　　什么是 XML ?

　　XML 指可扩展标记语言(eXtensible Markup Language)。

　　可扩展标记语言，标准通用标记语言的子集，一种用于标记电子文件使其具有结构性的标记语言。

　　它可以用来标记数据、定义数据类型，是一种允许用户对自己的标记语言进行定义的源语言。它非常适合万维网传输，提供统一的方法来描述和交换独立于应用程序或供应商的结构化数据。

　　更多内容请查看我们的 XML 教程

　　XML解析器结构和API

　　XML的解析器主要有DOM和SAX两种。

　　SAX解析器是基于事件处理的，需要从头到尾把XML文档扫描一遍，在扫描的过程中，每次遇到一个语法结构时，就会调用这个特定语法结构的事件处理程序，向应用程序发送一个事件。

　　DOM是文档对象模型解析，构建文档的分层语法结构，在内存中建立DOM树，DOM树的节点以对象的形式来标识，文档解析文成以后，文档的整个DOM树都会放在内存中。

　　Ruby 中解析及创建 XML

　　RUBY中对XML的文档的解析可以使用这个库REXML库。

　　REXML库是ruby的一个XML工具包，是使用纯Ruby语言编写的，遵守XML1.0规范。

　　在Ruby1.8版本及其以后，RUBY标准库中将包含REXML。

　　REXML库的路径是： rexml/document

　　所有的方法和类都被封装到一个REXML模块内。

　　REXML解析器比其他的解析器有以下优点：

　　100% 由 Ruby 编写。

　　可适用于 SAX 和 DOM 解析器。

　　它是轻量级的,不到2000行代码。

　　很容易理解的方法和类。

　　基于 SAX2 API 和完整的 XPath 支持。

　　使用 Ruby 安装，而无需单独安装。

　　以下为实例的 XML 代码，保存为movies.xml:

　　War, Thriller

　　DVD

　　2003

　　Talk about a US-Japan war

　　Anime, Science Fiction

　　DVD

　　1989

　　A schientific fiction

　　Anime, Action

　　DVD

　　Vash the Stampede!

　　Comedy

　　VHS

　　Viewable boredom

　　DOM 解析器

　　让我们先来解析 XML 数据，首先我们先引入 rexml/document 库，通常我们可以将 REXML 在顶级的命名空间中引入：

　　#!/usr/bin/ruby -w

　　require 'rexml/document'

　　include REXML

　　xmlfile = File.new("movies.xml")

　　xmldoc = Document.new(xmlfile)

　　# 获取 root 元素

　　root = xmldoc.root

　　puts "Root element : " + root.attributes["shelf"]

　　# 以下将输出电影标题

　　xmldoc.elements.each("collection/movie"){

　　|e| puts "Movie Title : " + e.attributes["title"]

　　}

　　# 以下将输出所有电影类型

　　xmldoc.elements.each("collection/movie/type") {

　　|e| puts "Movie Type : " + e.text

　　}

　　# 以下将输出所有电影描述

　　xmldoc.elements.each("collection/movie/description") {

　　|e| puts "Movie Description : " + e.text

　　}

　　以上实例输出结果为：

　　Root element : New Arrivals

　　Movie Title : Enemy Behind

　　Movie Title : Transformers

　　Movie Title : Trigun

　　Movie Title : Ishtar

　　Movie Type : War, Thriller

　　Movie Type : Anime, Science Fiction

　　Movie Type : Anime, Action

　　Movie Type : Comedy

　　Movie Description : Talk about a US-Japan war

　　Movie Description : A schientific fiction

　　Movie Description : Vash the Stampede!

　　Movie Description : Viewable boredom

　　SAX-like Parsing:

　　SAX 解析器

　　处理相同的数据文件：movies.xml，不建议SAX的解析为一个小文件，以下是个简单的实例：

　　#!/usr/bin/ruby -w

　　require 'rexml/document'

　　require 'rexml/streamlistener'

　　include REXML

　　class MyListener

　　include REXML::StreamListener

　　def tag_start(*args)

　　puts "tag_start: #{args.map {|x| x.inspect}.join(', ')}"

　　end

　　def text(data)

　　return if data =~ /^\w*$/ # whitespace only

　　abbrev = data[0..40] + (data.length > 40 ? "..." : "")

　　puts " text : #{abbrev.inspect}"

　　end

　　list = MyListener.new

　　xmlfile = File.new("movies.xml")

　　Document.parse_stream(xmlfile, list)

　　以上输出结果为：

　　tag_start: "collection", {"shelf"=>"New Arrivals"}

　　tag_start: "movie", {"title"=>"Enemy Behind"}

　　tag_start: "type", {}

　　text : "War, Thriller"

　　tag_start: "format", {}

　　tag_start: "year", {}

　　tag_start: "rating", {}

　　tag_start: "stars", {}

　　tag_start: "description", {}

　　text : "Talk about a US-Japan war"

　　tag_start: "movie", {"title"=>"Transformers"}

　　tag_start: "type", {}

　　text : "Anime, Science Fiction"

　　tag_start: "format", {}

　　tag_start: "year", {}

　　tag_start: "rating", {}

　　tag_start: "stars", {}

　　tag_start: "description", {}

　　text : "A schientific fiction"

　　tag_start: "movie", {"title"=>"Trigun"}

　　tag_start: "type", {}

　　text : "Anime, Action"

　　tag_start: "format", {}

　　tag_start: "episodes", {}

　　tag_start: "rating", {}

　　tag_start: "stars", {}

　　tag_start: "description", {}

　　text : "Vash the Stampede!"

　　tag_start: "movie", {"title"=>"Ishtar"}

　　tag_start: "type", {}

　　tag_start: "format", {}

　　tag_start: "rating", {}

　　tag_start: "stars", {}

　　tag_start: "description", {}

　　text : "Viewable boredom"

　　XPath 和 Ruby

　　我们可以使用XPath来查看XML ,XPath 是一门在 XML 文档中查找信息的语言(查看：XPath 教程)。

　　XPath即为XML路径语言，它是一种用来确定XML(标准通用标记语言的子集)文档中某部分位置的语言。XPath基于XML的树状结构，提供在数据结构树中找寻节点的能力。

　　Ruby 通过 REXML 的 XPath 类支持 XPath，它是基于树的分析(文档对象模型)。

　　#!/usr/bin/ruby -w

　　require 'rexml/document'

　　include REXML

　　xmlfile = File.new("movies.xml")

　　xmldoc = Document.new(xmlfile)

　　# 第一个电影的信息

　　movie = XPath.first(xmldoc, "//movie")

　　p movie

　　# 打印所有电影类型

　　XPath.each(xmldoc, "//type") { |e| puts e.text }

　　# 获取所有电影格式的类型，返回数组

　　names = XPath.match(xmldoc, "//format").map {|x| x.text }

　　p names

　　以上实例输出结果为：

　　 ...

　　War, Thriller

　　Anime, Science Fiction

　　Anime, Action

　　Comedy

　　["DVD", "DVD", "DVD", "VHS"]

　　XSLT 和 Ruby

　　Ruby 中有两个 XSLT 解析器，以下给出简要描述：

　　Ruby-Sablotron

　　这个解析器是由正义Masayoshi Takahash编写和维护。这主要是为Linux操作系统编写的，需要以下库：

　　Sablot

　　Iconv

　　Expat

　　你可以在 Ruby-Sablotron 找到这些库。

　　XSLT4R

　　XSLT4R 由 Michael Neumann 编写。 XSLT4R 用于简单的命令行交互，可以被第三方应用程序用来转换XML文档。

　　XSLT4R需要XMLScan操作，包含了 XSLT4R 归档，它是一个100%的Ruby的模块。这些模块可以使用标准的Ruby安装方法(即Ruby install.rb)进行安装。

　　XSLT4R 语法格式如下：

　　ruby xslt.rb stylesheet.xsl document.xml [arguments]

　　如果您想在应用程序中使用XSLT4R，您可以引入XSLT及输入你所需要的参数。实例如下：

　　require "xslt"

　　stylesheet = File.readlines("stylesheet.xsl").to_s

　　xml_doc = File.readlines("document.xml").to_s

　　arguments = { 'image_dir' => '/....' }

　　sheet = XSLT::Stylesheet.new( stylesheet, arguments )

　　# output to StdOut

　　sheet.apply( xml_doc )

　　# output to 'str'

　　str = ""

　　sheet.output = [ str ]

　　sheet.apply( xml_doc )

　　(编辑：雷林鹏来源：网络)

雷林鹏分享：Ruby XML, XSLT 和 XPath 教程的更多相关文章

雷林鹏分享：使用 XSLT 显示 XML
使用 XSLT 显示 XML 通过使用 XSLT,您可以把 XML 文档转换成 HTML 格式. 使用 XSLT 显示 XML XSLT 是首选的 XML 样式表语言. XSLT(eXtensible ...
雷林鹏分享：XML 相关技术
XML 相关技术下面是一个 XML 技术的列表. XHTML (可扩展 HTML) 更严格更纯净的基于 XML 的 HTML 版本. XML DOM (XML 文档对象模型) 访问和操作 XML 的 ...
雷林鹏分享：XML 编辑器
XML 编辑器如果您希望极认真地学习和使用 XML,那么您一定会从一款专业的 XML 编辑器的使用上受益. XML 是基于文本的 XML 是基于文本的标记语言. 关于 XML 的一件很重要的事情是, ...
雷林鹏分享：XML 命名空间
XML 命名空间 XML 命名空间提供避免元素命名冲突的方法. 命名冲突在 XML 中,元素名称是由开发者定义的,当两个不同的文档使用相同的元素名时,就会发生命名冲突. 这个 XML 携带 HTML ...
雷林鹏分享：XML - E4X
XML - E4X E4X 向 JavaScript 添加了对 XML 的直接支持. E4X 实例 var employees= Tove 32 Jani 26 ; document.write(em ...
雷林鹏分享：XML 实例
XML 实例这些例子演示了 XML 文件.XML 格式化和 XML 转换(XSLT). 还演示了与 XML 一起使用的 JavaScript(AJAX). 查看 XML 文件查看一个简单的 XML ...
雷林鹏分享：XML 总结下一步学习什么呢？
XML 总结下一步学习什么呢? XML 总结 XML 可用于交换.共享和存储数据. XML 文档形成树状结构,在"根"和"叶子"的分支机构开始的. XML ...
雷林鹏分享：XML 简介
XML 简介 XML 被设计用来传输和存储数据. HTML 被设计用来显示数据. 应该掌握的基础知识在您继续学习之前,需要对以下知识有基本的了解: HTML JavaScript 如果您希望首先学习 ...
雷林鹏分享：XML 教程
XML 教程 XML 指可扩展标记语言(eXtensible Markup Language). XML 被设计用来传输和存储数据. XML 很重要,也很容易学习. 现在开始学习 XML! XML 文 ...

随机推荐

6.IIs部署与发布
A.网站的发布步骤: 1.首先要选择要发布的网站(即项目里的网站)也就是代码. 2.左键选择发布. 3.配置文件:Web.congig. 4.连接:publis method:File System, ...
SpringBoot实现热加载方式
一. spring-boot-devtools方式1.在pom.xml中加入以下代码: 2.标识红线的地方加上 3.在设置里面加上自动编译 4.shift+ctrl+alt+/ 这样就可以了! 二.s ...
【转】B2C电子商务系统设计精选
B2C电子商务系统研发——促销引擎设计(一)(Promotion Engine) B2C电子商务系统研发——商品SKU分析和设计(一) B2C电子商务系统研发——商品SKU分析和设计(二) 电商后台系 ...
OGG双向复制
注意:在进行如下配置之前,先在源数据库(原来的目标数据库)端添加辅助的redolog配置: 1.SQL> alter database add supplemental log dat ...
Rochambeau---poj2912||zoj2751(并查集类似于食物链)
题目链接:http://poj.org/problem?id=2912 http://acm.zju.edu.cn/onlinejudge/showProblem.do?problemId=1751 ...
Can you solve this equation?---hdu2199（二分）
http://acm.hdu.edu.cn/showproblem.php?pid=2199 给出y的值求x: 8*x^4 + 7*x^3 + 2*x^2 + 3*x + 6 = Y x是0到100的 ...
以太坊geth主网全节点部署
以太坊geth主网全节点部署 #环境 ubuntu 16.4 #硬盘500GB(目前占用200G) #客户端安装 # 查看下载页面最新版 # https://ethereum.github.io/go ...
第1章 1.7计算机网络概述--理解OSI参考模型分层思想
OSI七层模型,知识参考理论. 分层标准的好处: 1.不同的硬件生产商生产的硬件产品,连通后就可以用了,有助于互联网发展. 2.分层,分成不同的模块,某一层的变化,不会影响其他层.如:IPv4改为IP ...
mysql 表的增删改查修改表结构
四.修改表结构语法: . 修改表名 ALTER TABLE 表名 RENAME 新表名; . 增加字段 ALTER TABLE 表名 ADD 字段名数据类型 [完整性约束条件…], ADD 字段名 ...
shell 环境变量的知识小结
环境变量的知识小结:·变量名通常要大写.·变量可以在自身的Shell及子Shell中使用.·常用export来定义环境变量.·执行env默认可以显示所有的环境变量名称及对应的值.·输出时用“$变量名” ...

雷林鹏分享：Ruby XML, XSLT 和 XPath 教程

雷林鹏分享：Ruby XML, XSLT 和 XPath 教程的更多相关文章

随机推荐

热门专题