1、XPath介绍

  • XPath (XML Path Language) 是一门在 XML 文档中查找信息的语言。XPath 用于在 XML 文档中通过元素和属性进行导航。
  • XPath 包含一个标准函数库:XPath 含有超过 100 个内建的函数。这些函数用于字符串值、数值、日期和时间比较、节点和 QName 处理、序列处理、逻辑值等等。
  • XPath 路径表达式:XPath 使用路径表达式来选取 XML 文档中的节点或者节点集。这些路径表达式和我们在常规的电脑文件系统中看到的表达式非常相似。
  • XPath 是一个 W3C 标准。

    W3School官方文档:http://www.w3school.com.cn/xpath/index.asp
  • HTML是标准的XML,所以HTML也可以使用XPath。

2、什么是XML

(1)XML介绍

XML是指扩展标记语言,是标准通用标记语言的一个子集;与HTML类似,但它并非HTML的替代品,它们为不同的目的而设计。

HTML被设计用来显示数据,其焦点是数据的外观。XML被设计为传输和存储数据,其焦点是数据的内容。

总结:

  • XML 指可扩展标记语言(EXtensible Markup Language)。
  • XML 是一种标记语言,很类似 HTML 。
  • XML 的设计宗旨是传输数据,而非显示数据。

(2)XML实例

<?xml version="1.0" encoding="UTF-8"?>
<bookstore>
<book>
   <title lang="eng">Harry Potter</title>
   <price>29.99</price>
</book>
<book>
    <title lang="eng">Learning XML</title>
   <price>39.95</price>
</book>
</bookstore>

(3)XML使用

如上所示,进行下面的选取:

# 1.选取属于 bookstore 子元素的第一个 book 元素。
/bookstore/book[1] # 2.选取属于 bookstore 子元素的最后一个 book 元素。
/bookstore/book[last()] # 3.选取属于 bookstore 子元素的倒数第二个 book 元素。
/bookstore/book[last()-1]

3、XML与HTML对比

如下图所示:

4、为什么使用XPath定位页面中的元素

  • 当元素没有idnameclass属性该如何定位?
  • 当元素idnameclass属性为动态时如何定位?也就是相同的元素,每次加载页面时,该元素id属性的值是不同的。

这个时候就需要使用XPathcss_selector来定位。

这两种方式可以解决90%左右的元素定位。

5、XPath中节点之间的关系

(1)节点的概念

每个XML/HTML的标签我们都称之为节点。

如下图所示:

(2)节点之间的关系类型

如下图所示:

1)父节点(Parent

在上图中:book元素是 titleauthoryear 以及 price 元素的父节点。

2)子节点(Children

每个元素节点可有零个、一个或多个子节点。

在上图中:titleauthoryear 以及 price 元素都是 book元素的子节点。

3)同胞(Sibling

拥有相同的父的节点的元素。

在上图中:titleauthoryear 以及 price 元素都是同胞节点。

4)先辈(Ancestor

某个节点的父节点、父的父节点,以此类推。

在上图中:title 元素的先辈是 book 元素和 bookstore 元素。

5)后代(Descendant

某个节点的子节点,子的子节点,以此类推。

在上图中:bookstore 的后代是 booktitleauthoryear 以及 price 元素。

6)基本值(或称原子值,Atomic value

基本值是无父或无子的节点。

即:基本值是以上节点的文本内容或者属性值。

在上图中,基本值的例子:

J K. Rowling
"en"

6、XPath路径表达式语法

XPath 使用路径表达式来选取 XML 文档中的节点或者节点集,这些路径表达式和我们在常规的电脑文件系统中看到的表达式非常相似。

示例代码:

<bookstore>
<book>
<title lang="eng">Harry Potter</title>
<price>29.99</price>
</book> <book>
<title lang="eng">Learning XML</title>
<price>39.95</price>
</book>
</bookstore>

(1)基本定位语法:

XPath 使用路径表达式在 XML 文档中选取节点。节点是通过沿着路径或者 step 来选取的。

下面列出了最常用的路径表达式:

表达式 描述
nodename 选取此节点的所有子节点。
/ 从根节点选取。
// 从匹配选择的当前节点选择文档中的节点,而不考虑它们的位置。
. 选取当前节点。
.. 选取当前节点的父节点。
@ 选取属性。

(2)实例:

路径表达式 结果
bookstore 选取 bookstore 元素的所有子节点。
/bookstore 选取根元素 bookstore。注释:假如路径起始于正斜杠( / ),则此路径始终代表到某元素的绝对路径!
bookstore/book 选取属于 bookstore 的子元素的所有 book 元素。
//book 选取所有 book 子元素,而不管它们在文档中的位置。
bookstore//book 选择属于 bookstore 元素的后代的所有 book 元素,而不管它们位于 bookstore 之下的什么位置。
//@lang 选取名为 lang 的所有属性。

(3)路径表达式总结:

  1. 绝对路径(一般不用)

    /开头表示,如:
    # 查找账号A输入框路径
    /html/body/form/div/fieldset/p/input
  2. 相对路径

    //开头表示 ,如:
    # 标签名[@属性名="属性值"](总结就是:标签+属性定位)
    # 例如:
    //input[@type="textA"]

注意:我们在适用XPath定位页面中元素的时候,很少使用绝对路径。因为有时候使用绝对路径,我们的XPath路径表达式会很长,其中只要有一个标签有变动,这个定位就会失效,所以在绝大多数的时候,都直接使用相对路径来定位元素。

『心善渊』Selenium3.0基础 — 5、XPath路径表达式详细介绍的更多相关文章

  1. 『心善渊』Selenium3.0基础 — 24、Selenium的expected_conditions模块详细介绍

    目录 1.EC模块介绍 2.EC模块常用类 3.EC模块的使用 4.EC模块综合使用 (1)title_is(title)示例 (2)presence_of_element_located(locat ...

  2. 『心善渊』Selenium3.0基础 — 11、Selenium对元素常用操作

    目录 1.Selenium对元素常用操作 2.Selenium对元素的其他操作 1.Selenium对元素常用操作 操作 说明 click() 单击元素 send_keys() 模拟输入 clear( ...

  3. 『心善渊』Selenium3.0基础 — 12、Selenium操作鼠标和键盘事件

    目录 (一)对鼠标的操作 1.鼠标事件介绍 2.ActionChains 类鼠标操作的常用方法 3.perform()方法 4.鼠标事件操作步骤 5.示例 (1)右键单击.左键双击 (2)鼠标拖拽动作 ...

  4. 『心善渊』Selenium3.0基础 — 1、Selenium自动化测试框架介绍

    目录 1.Selenium介绍 2.Selenium的特点 3.Selenium版本说明 4.拓展:WebDriver与Selenium RC的区别 5.Webdriver工作原理 1.Seleniu ...

  5. 『心善渊』Selenium3.0基础 — 6、Selenium中使用XPath定位元素

    目录 1.Selenium中使用XPath查找元素 (1)XPath通过id,name,class属性定位 (2)XPath通过标签中的其他属性定位 (3)XPath层级定位 (4)XPath索引定位 ...

  6. 『心善渊』Selenium3.0基础 — 10、使用Seleniun定位页面元素归纳总结(超详细)

    目录 1.Selenium中8种基本元素定位方式 (1)单数形式 (2)复数形式 2.By类定位的8种定位方式 (1)单数形式 (2)复数形式 3.XPath定位总结 (1)基础定位语法 (2)属性定 ...

  7. 『心善渊』Selenium3.0基础 — 2、Selenium测试框架环境搭建(Windows)

    目录 1.浏览器安装 2.浏览器驱动下载 (1)ChromeDriver for Chrome (2)Geckodriver for Firefox (3)IEDriverServer for IE ...

  8. 『心善渊』Selenium3.0基础 — 3、使用Selenium操作浏览器对象的基础API

    目录 1.导入Selenium库 2.创建浏览器对象 3.浏览器窗口大小设置 4.浏览器位置设置 5.请求访问网址 6.浏览器页面前进.后退和刷新 7.关闭浏览器 相比于高大上的各种Selenium进 ...

  9. 『心善渊』Selenium3.0基础 — 4、Selenium基础元素定位详解

    目录 1.什么是元素定位 2.Selenium元素定位常用API (1)By_id 定位 (2)by_name 定位 (3)by_class_name 定位 (4)by_tag_name 定位 (5) ...

随机推荐

  1. 【Docker】5. 常用命令—镜像命令

    学习命令,官方文档千万别忘记了,不会的就到这里来查. 一.帮助命令 1.显示docker哪些命令 docker --help 另外,也可以查看具体命令的用法,比如我想知道命令docker images ...

  2. Postman(接口自动化测试)

    1.Postman 接口测试参数化可能大家都非常的熟悉,但是很多人很难处理参数化后如何断言的问题,特别是当参数中出现中文时,很容易导致在 Runner 页面引入外部文件时导致中文乱码的问题,今天这篇文 ...

  3. Pytorch_Part1_简介&张量

    VisualPytorch beta发布了! 功能概述:通过可视化拖拽网络层方式搭建模型,可选择不同数据集.损失函数.优化器生成可运行pytorch代码 扩展功能:1. 模型搭建支持模块的嵌套:2. ...

  4. spring总结归纳

    愿历尽千帆,归来仍是少年 简介 spring: 1.是分层的full-stack(全栈)轻量级开源框架.2. 内核:IOC和AOP.3.提供web层springMvc和业务层事务管理,整合众多的开源框 ...

  5. [bug] logback error FileNotFoundException

    问题 在gitee上下载的项目,运行报错 原因 原程序中设置了日志保存路径,我的电脑没有,需要手动创建 参考 https://blog.csdn.net/danchaofan0534/article/ ...

  6. [bug] idea编译后没有xml文件

    原因 在maven中build 参考 https://www.cnblogs.com/lewskay/p/6422464.html https://blog.csdn.net/lovequanquqn ...

  7. [刷题] PTA 查验身份证

    题目: 7-63 查验身份证 (15 分)  一个合法的身份证号码由17位地区.日期编号和顺序编号加1位校验码组成.校验码的计算规则如下: 首先对前17位数字加权求和,权重分配为:{7,9,10,5, ...

  8. git 速度慢问题解决

    使用VPN上网后,如果git下载速度还是很慢说明没有正确设置代理 查看你的代理模式是否是pac代理,如果是改成全局或者Http代理,pac代理会选择性的代理网站,可能会略过某些网站. 如果还是比较慢则 ...

  9. k8s集群部署(2)

    一.利用ansible部署kubernetes准备阶段 1.集群介绍 基于二进制方式部署k8s集群和利用ansible-playbook实现自动化:二进制方式部署有助于理解系统各组件的交互原理和熟悉组 ...

  10. centos7安装google-chrome

    完整的安装步骤:https://www.tecmint.com/install-google-chrome-on-redhat-centos-fedora-linux/ 1.简单安装测试版:sudo ...