XPath语法规则及实例
XPath语法规则及实例
一、XPath术语:
1.节点:在XPath中,有七种类型的节点:元素、属性、文本、命名空间、处理指令、注释以及文档(根)节点。
XML文档是被作为节点树来对待的。树的根被称为文档节点或者根节点。
实例
1:XML文档:
<?xml version="1.0" encoding="ISO-8859-1"?>
<bookstore>
<book>
<title lang="en">Harry Potter</title>
<author>J K. Rowling</author>
<year>2005</year>
<price>29.99</price>
</book>
</bookstore>
上面的XML文档中的节点例子:<bookstore>(文档节点),<author>J K. Rowling</author>(元素节点),lang="en"(属性节点)。
2.基本值(或称原子值,Atomic value)
基本值是无父或无子的节点。基本值的例子:在实例1的xml文档中J K. Rowling、"en"
3.项目(Item)项目是基本值或者节点。
4.节点的关系:
1)父节点(Parent):每个元素以及属性都有一个父。在上面实例1的xml 文档中,book 元素是 title、author、year 以及price 元素的父节点。
2)子节点(Children):元素节点可有零个、一个或多个子。在上面实例1的xml 文档中,title、author、year 以及price 元素都是book 元素的子。
3)同胞(Sibling):拥有相同的父的节点,在上面实例1的xml 文档中,title、author、year 以及price 元素都是同胞。
4)先辈(Ancestor)某节点的父、父的父,等等。在实例1的xml 文档中,title 元素的先辈是book 元素和bookstore 元素。
5)后代(Descendant)某个节点的子,子的子,等等。在实例1的xml 文档中,bookstore 的后代是book、title、author、year 以及price 元素。
二、XPath语法:
XPath 使用路径表达式来选取XML 文档中的节点或节点集。节点是通过沿着路径(path) 或者步(steps) 来选取的。我们将在下面的例子中使用这个XML 文档:
<?xml version="1.0" encoding="ISO-8859-1"?>
<bookstore>
<book>
<title lang="eng">Harry Potter</title>
<price>29.99</price>
<title lang="eng">Learning XML</title>
<price>39.95</price>
</book>
</bookstore>
1.选取节点XPath 使用路径表达式在XML 文档中选取节点。节点是通过沿着路径或者step 来选取的。下面列出了最有用的路径表达式:
表达式描述nodename 选取此节点的所有子节点。

实例:在下面的表格中,我们已列出了一些路径表达式以及表达式的结果:

2.谓语(Predicates)
谓语用来查找某个特定的节点或者包含某个指定的值的节点,谓语被嵌在方括号中。
实例:在下面的表格中,我们列出了带有谓语的一些路径表达式,以及表达式的结果:


3.选取未知节点XPath
通配符可用来选取未知的 XML 元素。

实例:在下面的表格中,我们列出了一些路径表达式,以及这些表达式的结果:

4.选取若干路径
通过在路径表达式中使用“|”运算符,您可以选取若干个路径。
实例:在下面的表格中,我们列出了一些路径表达式,以及这些表达式的结果:

XPath语法规则及实例
我们将在下面的例子中使用此XML 文档:

1.XPath 轴
轴可定义相对于当前节点的节点集。

2.位置路径表达式
位置路径可以是绝对的,也可以是相对的。绝对路径起始于正斜杠( / ),而相对路径不会这样。在两种情况中,位置路径均包括一个或多个步,每个步均被斜杠分割:
绝对位置路径:/step/step/...
相对位置路径:step/step/...
每个步均根据当前节点集之中的节点来进行计算。
3.步(step)包括:
轴(axis):定义所选节点与当前节点之间的树关系。
节点测试(node-test):识别某个轴内部的节点。
零个或者更多谓语(predicate):更深入地提炼所选的节点集。
步的语法:轴名称::节点测试[谓语]。
实例:

4.常用函数:
last() 节点数组的最后一个
position() 下标索引,从1开始
text() 节点的文本内容
contains(@attr, 'value') 模糊匹配
starts-with(@attr, 'value') 是否以指定字符开头
count(@attr) 匹配次数
string-length() 返回字符串的字符数,你应该用<替代<, 用>代替>
normalize-space() 函数删除了前部和尾部的空格, 并且把连续的空格串替换为一个单一的空格


五、XPath 实例
实例一







文章来源于:https://wenku.baidu.com/view/64d6c115f18583d0496459e0.html
XPath语法规则及实例的更多相关文章
- xpath语法规则
参考w3cschool教程 XPath 是一门在 XML 文档中查找信息的语言.XPath 可用来在 XML 文档中对元素和属性进行遍历. XPath 是 W3C XSLT 标准的主要元素,并且 XQ ...
- xml的xPath解析规则
一,为什么要用xpath技术 问题:当使用dom4j查询比较深的层次结构的节点(标签,属性,文本),比较麻烦!!! 二,xpath的规则 2.1,/根元素的案例 /AAA 选择根元素AAA ...
- XML 树结构,语法规则,元素,属性,验证及其解析
XML 文档形成了一种树结构,它从"根部"开始,然后扩展到"枝叶". 一个 XML 文档实例 XML 文档使用简单的具有自我描述性的语法: <?xml v ...
- Python爬虫之xpath语法及案例使用
Python爬虫之xpath语法及案例使用 ---- 钢铁侠的知识库 2022.08.15 我们在写Python爬虫时,经常需要对网页提取信息,如果用传统正则表达去写会增加很多工作量,此时需要一种对数 ...
- Python爬虫利器三之Xpath语法与lxml库的用法
前面我们介绍了 BeautifulSoup 的用法,这个已经是非常强大的库了,不过还有一些比较流行的解析库,例如 lxml,使用的是 Xpath 语法,同样是效率比较高的解析方法.如果大家对 Beau ...
- Dom4j使用Xpath语法读取xml节点
我们可以使用Xpath的语法来轻易的读取xml的某个节点[类似于jQuery的选择器]: 使用Xpath语法需要添加新的jaxen-1.1-beta-7.rar 这个jar包 dom4j完整jar包我 ...
- XDocument读取xml的所有元素以及XPath语法
原文 http://www.cnblogs.com/xxyishutong/p/3326375.html <?xml version="1.0" encoding=&quo ...
- 芝麻HTTP:Python爬虫利器之Xpath语法与lxml库的用法
安装 pip install lxml 利用 pip 安装即可 XPath语法 XPath 是一门在 XML 文档中查找信息的语言.XPath 可用来在 XML 文档中对元素和属性进行遍历.XPat ...
- 爬虫解析之css,xpath语法
一.xpath语法 xpath实例文档 <?xml version="1.0" encoding="ISO-8859-1"?> <bookst ...
随机推荐
- Zookeeper发布订阅之SpringBoot+Mybatis多数据源
1.前言 数据发布/订阅系统,即所谓的配置中心,顾名思义就是发布者将数据发布到Zookeeper的一个或一系列节点上,供订阅者进行数据订阅,进而达到动态获取数据的目的,实现配置信息的集中管理和数据的动 ...
- Unity开发Android应用优化指南(下)
http://forum.china.unity3d.com/thread-27044-1-1.html 在Unity开发Android应用优化指南(上)一文中,从游戏性能,脚本等方面进行了分析和总结 ...
- Openjudge2729 Blah数集(单调队列)
2729:Blah数集 总时间限制: 3000ms 内存限制: 65536kB 描述 大数学家高斯小时候偶然间发现一种有趣的自然数集合Blah,对于以a为基的集合Ba定义如下:(1) a是集合Ba ...
- linux 初始配置(centos)-网络和可视化界面
1. 执行命令查看ip:ip addr 2. 如果没有或取到,要查看网卡是否启动,及ip配置是否正确,请先将ONBOOT改成yes,表示开机即启动 [lobin@localhost ~]$ cat / ...
- Codeforces Round #527-D1. Great Vova Wall (Version 1)(思维+栈)
time limit per test 2 seconds memory limit per test 256 megabytes input standard input output standa ...
- curl_setopt 注意
最近碰到好多奇怪的BUG,今天就是一个例子. 我在用CURL调用麦考林的接口,在浏览器测试完全没问题,调用全都成功.但是用命令行执行PHP时,却一直不行,返回http code 302错误.百思不得其 ...
- Jquery树形控件 $.fn.zTree.init
https://www.cnblogs.com/jin-/p/4646202.html asp.net 树形控件 $.fn.zTree.init 在网页中通过jquery脚本来构筑树形控件将是一个不错 ...
- memcache和iptables开启11211端口
linux下安装完memcached后,netstat -ant | grep LISTEN 看到memcache用的11211端口已在监听状态,但建立php文件连接测试发现没有输出结果,iptabl ...
- Webstorm 激活
注册时,在打开的License Activation窗口中选择“License server”,在输入框输入下面的网址: http://idea.iteblog.com/key.php 点击:Acti ...
- 对于拼接进去的html原来绑定的jq事件失效
JQ拼接显示的页面中鼠标事件失效 由于是先加载html在用js层绑定的所有后来加进来的html内容就不再绑定js了 所以我们需要利用delegate绑定,但是同样道理也不能写在普通的方法层里,因为这样 ...