1、XPath介绍

  • XPath (XML Path Language) 是一门在 XML 文档中查找信息的语言。XPath 用于在 XML 文档中通过元素和属性进行导航。
  • XPath 包含一个标准函数库:XPath 含有超过 100 个内建的函数。这些函数用于字符串值、数值、日期和时间比较、节点和 QName 处理、序列处理、逻辑值等等。
  • XPath 路径表达式:XPath 使用路径表达式来选取 XML 文档中的节点或者节点集。这些路径表达式和我们在常规的电脑文件系统中看到的表达式非常相似。
  • XPath 是一个 W3C 标准。

    W3School官方文档:http://www.w3school.com.cn/xpath/index.asp
  • HTML是标准的XML,所以HTML也可以使用XPath。

2、什么是XML

(1)XML介绍

XML是指扩展标记语言,是标准通用标记语言的一个子集;与HTML类似,但它并非HTML的替代品,它们为不同的目的而设计。

HTML被设计用来显示数据,其焦点是数据的外观。XML被设计为传输和存储数据,其焦点是数据的内容。

总结:

  • XML 指可扩展标记语言(EXtensible Markup Language)。
  • XML 是一种标记语言,很类似 HTML 。
  • XML 的设计宗旨是传输数据,而非显示数据。

(2)XML实例

<?xml version="1.0" encoding="UTF-8"?>
<bookstore>
<book>
   <title lang="eng">Harry Potter</title>
   <price>29.99</price>
</book>
<book>
    <title lang="eng">Learning XML</title>
   <price>39.95</price>
</book>
</bookstore>

(3)XML使用

如上所示,进行下面的选取:

# 1.选取属于 bookstore 子元素的第一个 book 元素。
/bookstore/book[1] # 2.选取属于 bookstore 子元素的最后一个 book 元素。
/bookstore/book[last()] # 3.选取属于 bookstore 子元素的倒数第二个 book 元素。
/bookstore/book[last()-1]

3、XML与HTML对比

如下图所示:

4、为什么使用XPath定位页面中的元素

  • 当元素没有idnameclass属性该如何定位?
  • 当元素idnameclass属性为动态时如何定位?也就是相同的元素,每次加载页面时,该元素id属性的值是不同的。

这个时候就需要使用XPathcss_selector来定位。

这两种方式可以解决90%左右的元素定位。

5、XPath中节点之间的关系

(1)节点的概念

每个XML/HTML的标签我们都称之为节点。

如下图所示:

(2)节点之间的关系类型

如下图所示:

1)父节点(Parent

在上图中:book元素是 titleauthoryear 以及 price 元素的父节点。

2)子节点(Children

每个元素节点可有零个、一个或多个子节点。

在上图中:titleauthoryear 以及 price 元素都是 book元素的子节点。

3)同胞(Sibling

拥有相同的父的节点的元素。

在上图中:titleauthoryear 以及 price 元素都是同胞节点。

4)先辈(Ancestor

某个节点的父节点、父的父节点,以此类推。

在上图中:title 元素的先辈是 book 元素和 bookstore 元素。

5)后代(Descendant

某个节点的子节点,子的子节点,以此类推。

在上图中:bookstore 的后代是 booktitleauthoryear 以及 price 元素。

6)基本值(或称原子值,Atomic value

基本值是无父或无子的节点。

即:基本值是以上节点的文本内容或者属性值。

在上图中,基本值的例子:

J K. Rowling
"en"

6、XPath路径表达式语法

XPath 使用路径表达式来选取 XML 文档中的节点或者节点集,这些路径表达式和我们在常规的电脑文件系统中看到的表达式非常相似。

示例代码:

<bookstore>
<book>
<title lang="eng">Harry Potter</title>
<price>29.99</price>
</book> <book>
<title lang="eng">Learning XML</title>
<price>39.95</price>
</book>
</bookstore>

(1)基本定位语法:

XPath 使用路径表达式在 XML 文档中选取节点。节点是通过沿着路径或者 step 来选取的。

下面列出了最常用的路径表达式:

表达式 描述
nodename 选取此节点的所有子节点。
/ 从根节点选取。
// 从匹配选择的当前节点选择文档中的节点,而不考虑它们的位置。
. 选取当前节点。
.. 选取当前节点的父节点。
@ 选取属性。

(2)实例:

路径表达式 结果
bookstore 选取 bookstore 元素的所有子节点。
/bookstore 选取根元素 bookstore。注释:假如路径起始于正斜杠( / ),则此路径始终代表到某元素的绝对路径!
bookstore/book 选取属于 bookstore 的子元素的所有 book 元素。
//book 选取所有 book 子元素,而不管它们在文档中的位置。
bookstore//book 选择属于 bookstore 元素的后代的所有 book 元素,而不管它们位于 bookstore 之下的什么位置。
//@lang 选取名为 lang 的所有属性。

(3)路径表达式总结:

  1. 绝对路径(一般不用)

    /开头表示,如:
    # 查找账号A输入框路径
    /html/body/form/div/fieldset/p/input
  2. 相对路径

    //开头表示 ,如:
    # 标签名[@属性名="属性值"](总结就是:标签+属性定位)
    # 例如:
    //input[@type="textA"]

注意:我们在适用XPath定位页面中元素的时候,很少使用绝对路径。因为有时候使用绝对路径,我们的XPath路径表达式会很长,其中只要有一个标签有变动,这个定位就会失效,所以在绝大多数的时候,都直接使用相对路径来定位元素。

『心善渊』Selenium3.0基础 — 5、XPath路径表达式详细介绍的更多相关文章

  1. 『心善渊』Selenium3.0基础 — 24、Selenium的expected_conditions模块详细介绍

    目录 1.EC模块介绍 2.EC模块常用类 3.EC模块的使用 4.EC模块综合使用 (1)title_is(title)示例 (2)presence_of_element_located(locat ...

  2. 『心善渊』Selenium3.0基础 — 11、Selenium对元素常用操作

    目录 1.Selenium对元素常用操作 2.Selenium对元素的其他操作 1.Selenium对元素常用操作 操作 说明 click() 单击元素 send_keys() 模拟输入 clear( ...

  3. 『心善渊』Selenium3.0基础 — 12、Selenium操作鼠标和键盘事件

    目录 (一)对鼠标的操作 1.鼠标事件介绍 2.ActionChains 类鼠标操作的常用方法 3.perform()方法 4.鼠标事件操作步骤 5.示例 (1)右键单击.左键双击 (2)鼠标拖拽动作 ...

  4. 『心善渊』Selenium3.0基础 — 1、Selenium自动化测试框架介绍

    目录 1.Selenium介绍 2.Selenium的特点 3.Selenium版本说明 4.拓展:WebDriver与Selenium RC的区别 5.Webdriver工作原理 1.Seleniu ...

  5. 『心善渊』Selenium3.0基础 — 6、Selenium中使用XPath定位元素

    目录 1.Selenium中使用XPath查找元素 (1)XPath通过id,name,class属性定位 (2)XPath通过标签中的其他属性定位 (3)XPath层级定位 (4)XPath索引定位 ...

  6. 『心善渊』Selenium3.0基础 — 10、使用Seleniun定位页面元素归纳总结(超详细)

    目录 1.Selenium中8种基本元素定位方式 (1)单数形式 (2)复数形式 2.By类定位的8种定位方式 (1)单数形式 (2)复数形式 3.XPath定位总结 (1)基础定位语法 (2)属性定 ...

  7. 『心善渊』Selenium3.0基础 — 2、Selenium测试框架环境搭建(Windows)

    目录 1.浏览器安装 2.浏览器驱动下载 (1)ChromeDriver for Chrome (2)Geckodriver for Firefox (3)IEDriverServer for IE ...

  8. 『心善渊』Selenium3.0基础 — 3、使用Selenium操作浏览器对象的基础API

    目录 1.导入Selenium库 2.创建浏览器对象 3.浏览器窗口大小设置 4.浏览器位置设置 5.请求访问网址 6.浏览器页面前进.后退和刷新 7.关闭浏览器 相比于高大上的各种Selenium进 ...

  9. 『心善渊』Selenium3.0基础 — 4、Selenium基础元素定位详解

    目录 1.什么是元素定位 2.Selenium元素定位常用API (1)By_id 定位 (2)by_name 定位 (3)by_class_name 定位 (4)by_tag_name 定位 (5) ...

随机推荐

  1. python爬虫——拉钩网python岗位信息

    之前爬取的网页都是采用"GET"方法,这次爬取"拉勾网"是采取了"POST"的方法.其中,"GET"和"POS ...

  2. MySQL中使用Show Profile

    Show profile 默认是禁用的,用处是记录在服务器中运行的查询耗费的时间和其他一些查询执行状态变更相关的数据. 当前系统是win10,Mysql版本是8.0.15 1.查看当前profilin ...

  3. Linux x86_64与i386区别之 —— 内存寻址

    毫无疑问,不管是32位,还是64位处理器,所有进程(执行的程序)都必须占用一定数量的内存,它或是用来存放从磁盘载入的程序代码,或是 存放取自用户输入的数据等等.不过进程对这些内存的管理方式因内存用途不 ...

  4. [bug] CDH报错:cloudera-scm-server dead but pid file exists

    参考 https://blog.csdn.net/levy_cui/article/details/51243335

  5. deep

    deepinv20已经解决 sudo apt update && sudo apt upgrade

  6. 置的测试文件的大小一定要大过你的内存(最佳为内存的两倍大小),不然linux会给你的读写的内容进行缓存,会使数值非常不准确。

    使用iozone测试磁盘性能   IOzone是一个文件系统测试基准工具.可以测试不同的操作系统中文件系统的读写性能.可以通过 write, re-write, read, re-read, rand ...

  7. WIN10 分区 C盘 至少250-300G E盘至少700G

    win10 就2个分区 C盘 至少250-300G  E盘至少700G

  8. elasticksearch分词,导致kibana的url出现问题

    在Kibana的展示页面中,我们点击Table的左侧栏,发现Elasticsearch中的数据在展示中是正确的数据,比如:agent中www.baidu.com/test,该界面中会正确的显示为www ...

  9. 电路调试检测维修总结积累 20181015 板子:3060-A

    今天在检修一块3060-A电路板时 发现   3.3V烫 但是3.3V路上的电容并没有短路 于是拆单片机   拆RS232EN  拆  FM24V 最后发现  原来是  1117-3.3  处的33U ...

  10. week-01

    week-01 1. 计算机组成 从底层开始: 硬件: CPU.内存.硬盘.网卡.主板.显卡.风扇.电源.鼠标键盘 等: 系统: Linux.Windows.Mac 等: 软件: QQ.微信.吃鸡.农 ...