35、XPath的使用示例
使用Xpath获取页面元素
下面列出了最有用的路径表达式:
表达式 | 描述 |
---|---|
nodename | 选取此节点的所有子节点。 |
/ | 从根节点选取。 |
// | 从匹配选择的当前节点选择文档中的节点,而不考虑它们的位置。 |
. | 选取当前节点。 |
.. | 选取当前节点的父节点。 |
@ | 选取属性。 |
* | 匹配任何元素节点。 |
@* | 匹配任何属性节点。 |
node() | 匹配任何类型的节点。 |
| | 通过在路径表达式中使用“|”运算符,您可以选取若干个路径。 |
路径表达式 | 结果 |
---|---|
bookstore | 选取 bookstore 元素的所有子节点。 |
/bookstore |
选取根元素 bookstore。 |
bookstore/book | 选取属于 bookstore 的子元素的所有 book 元素。 |
//book | 选取所有 book 子元素,而不管它们在文档中的位置。 |
bookstore//book | 选择属于 bookstore 元素的后代的所有 book 元素,而不管它们位于 bookstore 之下的什么位置。 |
//@lang | 选取名为 lang 的所有属性。 |
//div/form/input[2] | 匹配 上级节点 div 下节点是 form 中的第二个 input 元素 |
//div//div[@id='ls']/span[position()=3] | position() 索引函数 |
//div//div[@id='ls']/span[position()<3] | position() 索引函数 |
//div//div[@id='ls']/span[last()] | last() 索引 表示同级的最后一个元素 |
//div//div[@id='ls']/span[last()-1] | last() 索引 表示同级的倒数第二个元素 |
//div//input[@type='radio' and @value='sx'] | and 匹配的input元素要两个条件同时满足 |
//div//input[@name='password' or @name="username"] | or 或者的关系,匹配的input元素两个条件满足一个即可 |
//div//input[not(@id='username')] | not 除了当前条件 匹配div中id不等于username的所有input元素 |
//a[contains(@class,'btn-primary')] | contains 匹配 a标签的class属性中包含btn-primary元素 |
//div//input[starts-with(@id,'user')] | starts-with 匹配当前id属性是以'user'开头的所有input元素 |
//div[substring(@id,1,11)='_mail_input'] | substring 匹配div中id的第1-11个字符内容为 _mail_input 的元素 |
//div[substring-before(@id,'-')='_mail_input_'] | substring-before 匹配div中id内容在 '-' 之前等于_mail_input_ 的元素 |
//div[substring-after(@id,'-')='_224' | substring-after 匹配div中id内容在 '-' 之后等于 _224 的元素 |
bookstore/* | 选取 bookstore 元素的所有子元素。 |
//* | 选取文档中的所有元素 |
//title[@*] | 选取所有带有属性的 title 元素。 |
//input[@*='radio'] | 选取所有属性值中有radio的input元素 |
//book/title | //book/price | 选取 book 元素的所有 title 和 price 元素。 |
//title | //price | 选取文档中的所有 title 和 price 元素。 |
/bookstore/book/title | //price | 选取属于 bookstore 元素的 book 元素的所有 title 元素,以及文档中所有的 price 元素。 |
XPath 轴
轴可定义相对于当前节点的节点集。
轴名称 | 结果 |
---|---|
ancestor | 选取当前节点的所有先辈(父、祖父等)。 |
ancestor-or-self | 选取当前节点的所有先辈(父、祖父等)以及当前节点本身。 |
child | 选取当前节点的所有子元素。 |
descendant | 选取当前节点的所有后代元素(子、孙等)。 |
descendant-or-self | 选取当前节点的所有后代元素(子、孙等)以及当前节点本身。 |
following | 选取文档中当前节点的结束标签之后的所有节点。 |
parent | 选取当前节点的父节点。 |
preceding | 选取文档中当前节点的开始标签之前的所有节点。 |
preceding-sibling | 选取当前节点之前的所有同级节点。 |
self | 选取当前节点。 |
语法:
轴名称::节点测试[谓语]
实例
例子 | 结果 |
---|---|
//div[@id='ls']/child::span | 选取所有id=ls的div节点的子元素 span 节点(div的子节点) |
//span/parent::div | 选取span的父节点是div的所有节点 |
//span/ancestor::tr | 选择span节点的所有 tr 先辈 |
//div[@id='ls']/descendant::a | 选取div节点的所有 a 后代 |
//div[@id='ls']/descendant-or-self::a | 选取div节点的所有 a 后代以及自己本身 |
//div[@id='ls']/ancestor-or-self::td | 选取div节点的所有 td 先辈以及自己本身 |
//span[@id='sf']/preceding-sibling::span | 选取当前节点之前的所有同级 span 节点 |
//span[@id='sf']/following-sibling::span | 选取当前节点之后的所有同级 span 节点 |
//span[@id='sf']/preceding::a | 选取当前span节点之前的所有 a 节点 |
//span[@id='sf']/following::a | 选取当前span节点之后的所有 a 节点 |
//span[@id='sf']/self::span | 选取当前节点span自己 |
35、XPath的使用示例的更多相关文章
- Selenium2学习-002-Selenium2 Web 元素定位及 XPath 编写演示示例
此文主要对 Selenium2 的 Web 元素定位及 XPath 编写示例,敬请各位亲们参阅,共同探讨.若有不足之处,敬请各位大神指正,不胜感激! 通过 Firefox(火狐)浏览器的插件 Fire ...
- 【转】XPath 示例
XPath 示例 其他版本 本主题回顾整个 XPath 参考中出现的语法示例. 所有示例均基于 XPath 语法的示例 XML 文件 (inventory.xml). 有关在测试文件中使用 X ...
- python 全栈开发,Day135(爬虫系列之第2章-BS和Xpath模块)
一.BeautifulSoup 1. 简介 简单来说,Beautiful Soup是python的一个库,最主要的功能是从网页抓取数据.官方解释如下: ''' Beautiful Soup提供一些简单 ...
- 如何从代码层防御10大安全威胁中的 Xpath Injection?
普遍性和可检测性: Xpath 注入是 OWASP TOP10 安全威胁中 A1 Injection 中的一种,注入漏洞发生在应用程序将不可信的数据发送到解释器时.虽然注入漏洞很容易通过审查代码发现, ...
- XPath与多线程爬虫
XPath是一门在xml中查询信息的语言安装使用XPath 1.安装lxml库 window:pip install lxmllinux:sudo pip install lxml国内安装缓慢,建议到 ...
- [IR] XPath for Search Query
XPath 1.0 XPath Containment Distributed Query Evaluation RE and DFA XPath 1.0 -- 在XML中的使用 XPath 语法: ...
- @1-4使用Xpath解析豆瓣短评
使用Xpath解析豆瓣短评 Python爬虫(入门+进阶) DC学院 本节课程主要介绍解析神器Xpath是什么.Xpath如何安装及使用,以及使用实际的例子讲解Xpath如何解析豆瓣短评的网页 ...
- [Java拾遗一] XML的书写规范与解析.
前言今天天气大好, 起了个大早开始总结一些常用的基础知识. XML一直来说都很陌生, 使用大多是用于配置文件, 之前并没有细究过其中的约束规范, 今天刚好没事来学习并总结下. 1,XML基础介绍 XM ...
- XSLT函数集合:数值函数、字符串函、节点集函数和布尔函数
任何的编程语言或者是SQL语句都有内置的函数或方法,而强大灵活的xslt技术也是如此.熟练掌握XSLT的常用函数的用法,XSLT的应用将变得如此轻松,你会发现XSLT比想象中还要牛!以下是xslt数值 ...
随机推荐
- android studio中使用x5 webview来读写cookies的问题
本人新手,刚接触AS也没有多久,记录下两个问题. 1. 怎么在android studio中写入cookies 把写入cookies的动作放在了主界面的onCreate事件中了,看了腾讯的说明,说是要 ...
- 线程池ThreadPool实现异步多线程
ThreadPool线程池的主要方法: 1. public static Boolean QueueUserWorkItem(WaitCallback wc, Object state); WaitC ...
- javascript dom与字符串相互转换
js dom与字符串相互转换 一.字符串转换dom: function stringToDom(str){ var obj=document.createElement("div" ...
- GTK+介绍
GTK+介绍 官方文档 GTK+ 学习 ### 在Ubuntu系统下 $ sudo apt-get intall gtk-3-examples GTK+ 依赖的函数库 Glib 提供了各种各样的语言特 ...
- Harbor安装 -- 企业级Registry仓库
(一)Harbor安装 -- 企业级Registry仓库 以下文章转自http://www.jianshu.com/p/2ebadd9a323d 根据Harbor官方描述: Harbor是一个用于存储 ...
- 【bzoj3209】: 花神的数论题 数论-DP
[bzoj3209]: 花神的数论题 首先二进制数中1的个数最多就是64个 设所有<=n的数里二进制中1的个数为i的有a[i]个 那么答案就是 然后快速幂 求a[i]可以用DP 设在二进制中从 ...
- LAMP之PHP
保持apache.mysql正在运行 [root@cairui php-]# lsof -i tcp: COMMAND PID USER FD TYPE DEVICE SIZE/OFF NODE NA ...
- SQLAlchemy外键的使用
orm可以将数据库存储的数据封装成对象,同时,如果封装的好的话,所有的数据库操作都可以封装到对象中.这样的代码在组织结构上会非常的清晰,并且相对与使用sql语句在sql注入方面会极具降低. SQLAl ...
- 装饰器设计模式初探及Java中实际应用举例
本篇随笔主要介绍用Java实现简单的装饰器设计模式: 先来看一下装饰器设计模式的类图: 从图中可以看到,我们可以装饰Component接口的任何实现类,而这些实现类也包括了装饰器本身,装饰器本身也可 ...
- PowerShell命令部署WSP
转载:http://www.cnblogs.com/ChunLiangZhang/archive/2012/07/18/2597335.html(作者:ChunLiang) 现在可以用SharePoi ...