XPath语法规则及实例

XPath语法规则

一、XPath术语:

1.节点:在XPath中,有七种类型的节点:元素、属性、文本、命名空间、处理指令、注释以及文档(根)节点。

XML文档是被作为节点树来对待的。树的根被称为文档节点或者根节点。

实例

1:XML文档:

<?xml version="1.0" encoding="ISO-8859-1"?> 

<bookstore> 

<book> 

<title lang="en">Harry Potter</title> 

<author>J K. Rowling</author> 

<year>2005</year> 

<price>29.99</price> 

</book> 

</bookstore> 

上面的XML文档中的节点例子:<bookstore>(文档节点),<author>J K. Rowling</author>(元素节点),lang="en"(属性节点)。

2.基本值(或称原子值,Atomic value)

基本值是无父或无子的节点。基本值的例子:在实例1的xml文档中J K. Rowling、"en" 

3.项目(Item)项目是基本值或者节点。

4.节点的关系:

1)父节点(Parent):每个元素以及属性都有一个父。在上面实例1的xml 文档中,book 元素是 title、author、year 以及price 元素的父节点。

2)子节点(Children):元素节点可有零个、一个或多个子。在上面实例1的xml 文档中,title、author、year 以及price 元素都是book 元素的子。

3)同胞(Sibling):拥有相同的父的节点,在上面实例1的xml 文档中,title、author、year 以及price 元素都是同胞。

4)先辈(Ancestor)某节点的父、父的父,等等。在实例1的xml 文档中,title 元素的先辈是book 元素和bookstore 元素。

5)后代(Descendant)某个节点的子,子的子,等等。在实例1的xml 文档中,bookstore 的后代是book、title、author、year 以及price 元素。

二、XPath语法:

XPath 使用路径表达式来选取XML 文档中的节点或节点集。节点是通过沿着路径(path) 或者步(steps) 来选取的。我们将在下面的例子中使用这个XML 文档:

<?xml version="1.0" encoding="ISO-8859-1"?> 

<bookstore> 

<book> 

<title lang="eng">Harry Potter</title> 

<price>29.99</price> 

</book> 
<book> 

<title lang="eng">Learning XML</title> 

<price>39.95</price> 

</book> 

</bookstore> 

1.选取节点XPath 使用路径表达式在XML 文档中选取节点。节点是通过沿着路径或者step 来选取的。下面列出了最有用的路径表达式:

 表达式描述nodename 选取此节点的所有子节点。

实例:在下面的表格中,我们已列出了一些路径表达式以及表达式的结果:

 2.谓语(Predicates)

 谓语用来查找某个特定的节点或者包含某个指定的值的节点,谓语被嵌在方括号中。

 实例:在下面的表格中,我们列出了带有谓语的一些路径表达式,以及表达式的结果:

3.选取未知节点XPath

 通配符可用来选取未知的 XML 元素。

实例:在下面的表格中,我们列出了一些路径表达式,以及这些表达式的结果:

 4.选取若干路径

 通过在路径表达式中使用“|”运算符,您可以选取若干个路径。

 实例:在下面的表格中,我们列出了一些路径表达式,以及这些表达式的结果:

XPath语法规则及实例

三、XPath Axes(坐标轴)

我们将在下面的例子中使用此XML 文档:

1.XPath 轴

轴可定义相对于当前节点的节点集。

2.位置路径表达式

 位置路径可以是绝对的,也可以是相对的。绝对路径起始于正斜杠( / ),而相对路径不会这样。在两种情况中,位置路径均包括一个或多个步,每个步均被斜杠分割:

 绝对位置路径:/step/step/... 

相对位置路径:step/step/... 

每个步均根据当前节点集之中的节点来进行计算。

3.步(step)包括:

轴(axis):定义所选节点与当前节点之间的树关系。

节点测试(node-test):识别某个轴内部的节点。

零个或者更多谓语(predicate):更深入地提炼所选的节点集。

步的语法:轴名称::节点测试[谓语]。

实例:

4.常用函数:

last()  节点数组的最后一个

position() 下标索引,从1开始

text()    节点的文本内容

contains(@attr, 'value')     模糊匹配

starts-with(@attr, 'value')  是否以指定字符开头

count(@attr)      匹配次数

string-length()       返回字符串的字符数,你应该用&lt;替代<, 用&gt;代替> 

normalize-space()    函数删除了前部和尾部的空格, 并且把连续的空格串替换为一个单一的空格

四、XPath 运算符:

五、XPath 实例

实例一

文章来源于:https://wenku.baidu.com/view/64d6c115f18583d0496459e0.html

 
 
 
 
 

 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

XPath语法规则及实例的更多相关文章

  1. xpath语法规则

    参考w3cschool教程 XPath 是一门在 XML 文档中查找信息的语言.XPath 可用来在 XML 文档中对元素和属性进行遍历. XPath 是 W3C XSLT 标准的主要元素,并且 XQ ...

  2. xml的xPath解析规则

    一,为什么要用xpath技术 问题:当使用dom4j查询比较深的层次结构的节点(标签,属性,文本),比较麻烦!!! 二,xpath的规则 2.1,/根元素的案例 /AAA 选择根元素AAA       ...

  3. XML 树结构,语法规则,元素,属性,验证及其解析

    XML 文档形成了一种树结构,它从"根部"开始,然后扩展到"枝叶". 一个 XML 文档实例 XML 文档使用简单的具有自我描述性的语法: <?xml v ...

  4. Python爬虫之xpath语法及案例使用

    Python爬虫之xpath语法及案例使用 ---- 钢铁侠的知识库 2022.08.15 我们在写Python爬虫时,经常需要对网页提取信息,如果用传统正则表达去写会增加很多工作量,此时需要一种对数 ...

  5. Python爬虫利器三之Xpath语法与lxml库的用法

    前面我们介绍了 BeautifulSoup 的用法,这个已经是非常强大的库了,不过还有一些比较流行的解析库,例如 lxml,使用的是 Xpath 语法,同样是效率比较高的解析方法.如果大家对 Beau ...

  6. Dom4j使用Xpath语法读取xml节点

    我们可以使用Xpath的语法来轻易的读取xml的某个节点[类似于jQuery的选择器]: 使用Xpath语法需要添加新的jaxen-1.1-beta-7.rar 这个jar包 dom4j完整jar包我 ...

  7. XDocument读取xml的所有元素以及XPath语法

    原文  http://www.cnblogs.com/xxyishutong/p/3326375.html <?xml version="1.0" encoding=&quo ...

  8. 芝麻HTTP:Python爬虫利器之Xpath语法与lxml库的用法

    安装 ​pip install lxml 利用 pip 安装即可 XPath语法 XPath 是一门在 XML 文档中查找信息的语言.XPath 可用来在 XML 文档中对元素和属性进行遍历.XPat ...

  9. 爬虫解析之css,xpath语法

    一.xpath语法 xpath实例文档 <?xml version="1.0" encoding="ISO-8859-1"?> <bookst ...

随机推荐

  1. mysql由浅入深探究(四)----mysql事务详解

    什么是事务: 通俗的解释就是对数据库进行的一组完整的操作,这组完整的操作中包含一个或多个操作.解释的太low了,来点官方的:事务就是DBMS中执行的一个完整的逻辑单元,这个逻辑单元中包含一个或者多个操 ...

  2. 51nod1186(Miller-Rabin)

    题目链接:http://www.51nod.com/onlineJudge/questionCode.html#!problemId=1186 题意:中文题目诶- 思路:miller_rabin模板 ...

  3. 剑指Offer的学习笔记(C#篇)-- 构建乘积数组

    题目描述 给定一个数组A[0,1,...,n-1],请构建一个数组B[0,1,...,n-1],其中B中的元素B[i]=A[0]*A[1]*...*A[i-1]*A[i+1]*...*A[n-1].不 ...

  4. hammerjs jquery的选项使用方法,以给swipe设置threshold和velocity为例

    先包含hammer.min.js和 jquery.hammer.js,然后: var $ele = $('#ele'); //复用jquerydom对象,建个变量 $ele.hammer().on(& ...

  5. thinkphp5实现mysql数据库备份

    其实备份数据库说白了就是向一个.sql的文档中写入一条一条的sql命令 public function back() { $to_file_name="backsql.sql"; ...

  6. centOS-7.5上安装redis-5.0.0

  7. shell学习(9)- du和df区别及详解

    清明小长假来加班,总得干点啥吧,今天就说说du 和df的区别. 1.区别 du,disk usage,是通过搜索文件来计算每个文件的大小然后累加,du能看到的文件只是一些当前存在的,没有删除的.他计算 ...

  8. CC20:高度最小的BST

    题目 对于一个元素各不相同且按升序排列的有序序列,请编写一个算法,创建一棵高度最小的二叉查找树. 给定一个有序序列int[] vals,请返回创建的二叉查找树的高度. 解法 这道题感觉如果没有创建树的 ...

  9. PHP的时间函数strtotime

    时间加减 [php] view plaincopy <?php //获取本地 提取年份+1 $date=date("Y-m-d",mktime(0,0,0,date(&quo ...

  10. marquee标签(跑马灯)