Xpath表达式的粗介绍

关于在自动化中Xpath表达式的书写，其实我也只是刚刚入门，粗略的跟着网上的教程学了一下，这篇我就来分享总结一下我学习到的知识。

首先呢，我们先认识一下什么是Xpath。Xpath是XML路径语言，它是一种用来确定XML（标准通用标记语言的子集）文档中某部分位置的语言。因为Xpath基于XML的树状结构，提供了在数据结构树种寻找节点的能力，所以Xpath被开发者们当做一种小型的查询语言。

关于如何在网页中获取元素的Xpath表达式，我在上一篇文章中就已经介绍过了，在这篇中就不重复叙说了。当然，我在上篇文章上也说了，这种通过工具获取的Xpath表达式，是死板的，不精确的，很容易找不到元素。在实际的项目中，Xpath的表达式可能会是很长的一句，或者关键信息会有相同的存在，所以我们不能够快速准确的获取好唯一的节点信息。这就需要用一些其他的表达方法来帮助我们了。这也是我写这篇文章的用意。介绍几种比较实用的Xpath定位方法。

text（）方法：这个方法我们用百度首页上的“新闻”按钮来举例。首先看网页源代码如下

我们可以看得出来在和“新闻”同类型的元素很多，他们的className是相同的，如果这时候源码中对方没有标出不同的name属性，那我对于我们获取新闻这个元素就很难了。这时候我们的text()方法就可以派上用场了。表达式：.//*[@id='u1']/a[text()='新闻']。也就是说，当我们要定位的元素是文本类型，且附近同类型元素太多时，我们就可以用text（）方法来快速定位到我们需要的文本元素。

这里我在个人推荐一下，面对这样一个唯一标签下面，一排同类型标签的时候，我们还有一种简单的Xpath表达式来定位元素。例如，我们想要定位的“新闻”元素，它排在这群文本的第一位，表达式可以写成：.//*[@id='u1']/a[1]。代表我要定位id为“u1”标签下所有已“a”标签起头的元素中的第一个元素。

在我目前的自动化学习过程中，我用到方法就是以上者三种方法，当然肯定还有更多其他好用的方法，不过对于我来说，目前这三种已经够用了。所以我也就简略的介绍了一下这三种方法。

Xpath表达式的粗介绍的更多相关文章

网络爬虫之Selenium模块和Xpath表达式+Lxml解析库的使用
实际生产环境下,我们一般使用lxml的xpath来解析出我们想要的数据,本篇博客将重点整理Selenium和Xpath表达式,关于CSS选择器,将另外再整理一篇! 一.介绍: selenium最初是一 ...
【XML】XPath表达式
XPath简介 XPath即为XML路径语言(XML Path Language),它是一种用来确定XML文档中某部分位置的语言. XPath基于XML的树状结构,提供在数据结构树中找寻节点的能力.起 ...
EL表达式的简单介绍
EL表达式的简单介绍一.JSP EL语言定义 E L(ExpressionLanguage) 目的:为了使JSP写起来更加简单. 表达式语言的灵感来自于ECMAScript 和 XPath 表达式 ...
第三百三十九节，Python分布式爬虫打造搜索引擎Scrapy精讲—Scrapy启动文件的配置—xpath表达式
第三百三十九节,Python分布式爬虫打造搜索引擎Scrapy精讲—Scrapy启动文件的配置—xpath表达式我们自定义一个main.py来作为启动文件 main.py #!/usr/bin/en ...
第三百三十六节，web爬虫讲解2—urllib库中使用xpath表达式—BeautifulSoup基础
第三百三十六节,web爬虫讲解2—urllib库中使用xpath表达式—BeautifulSoup基础在urllib中,我们一样可以使用xpath表达式进行信息提取,此时,你需要首先安装lxml模块 ...
urllib下使用Xpath表达式示例
urllib下使用Xpath表达式示例使用xpath表达式需要先将需要匹配的数据转换成tree格式,这就需要先装lxml模块.安装方法可以使用pip安装. 示例代码: import urllib.r ...
十八 Python分布式爬虫打造搜索引擎Scrapy精讲—Scrapy启动文件的配置—xpath表达式
我们自定义一个main.py来作为启动文件 main.py #!/usr/bin/env python # -*- coding:utf8 -*- from scrapy.cmdline import ...
十五 web爬虫讲解2—urllib库中使用xpath表达式—BeautifulSoup基础
在urllib中,我们一样可以使用xpath表达式进行信息提取,此时,你需要首先安装lxml模块,然后将网页数据通过lxml下的etree转化为treedata的形式 urllib库中使用xpath表 ...
selenium用css、xpath表达式进行元素定位
绝对路径选择从根节点开始的,到某个节点,每层都依次写下来,每层之间用 / 分隔的表达式,就是某元素的绝对路径 Xpath : /html/body/div CSS : html>body&g ...

随机推荐

WOJ#3882 旅行问题（POI2004）
描述 John打算驾驶一辆汽车周游一个环形公路.公路上总共有n车站,每站都有若干升汽油(有的站可能油量为零),每升油可以让汽车行驶一千米.John必须从某个车站出发,一直按顺时针(或逆时针)方向走遍所 ...
浏览器输入url按回车背后经历了哪些？
在PC浏览器的地址栏输入一串URL,然后按Enter键这个页面渲染出来,这个过程中都发生了什么事? 1.首先,在浏览器地址栏中输入url,先解析url,检测url地址是否合法2.浏览器先查看浏览器缓存 ...
POJ-3468 A Simple Problem with Integers (区间求和,成段加减)
You have N integers, A1, A2, ... , AN. You need to deal with two kinds of operations. One type of op ...
Python内建函数enumerate()用法及在for循环应用
Python 内建函数enumerate() 由于这个单纯很长,不容易记住,用法还是比较广泛的,下面讲述Python内建函数enumerate()用法. 1,实例 enumerate(sequence ...
pycharm中能运行，但是往往py都要放到服务器上去跑，问题来了
py文件在linux上运行,导包错误: 在py文件中添加项目的根目录: import sys sys.path.append('项目路径') sys.path.append(os.path.dirna ...
BZOJ 1911 特别行动队（斜率优化）
$ BZOJ~1911~*~ $ 特别行动队: (斜率优化) $ solution: $ 感觉这道题目还是比较常规的,首先我们很容易想到DP,因为题目里面说了选出的人都是连续的,这意味着我们可以从前往 ...
股票交易（单调队列优化DP）
股票交易 $ solution: $ 这道题以前就写了,题目很好,但自己没有发题解,来补一篇: 首先,题目出得很有迷惑性,但我们不难想到状态要设天数,和自己手上的股票数目(因为这两个就是充要信息).而 ...
Java EE的优越性主要表现在哪些方面
J2 EE的优越性主要表现在哪些方面 J2EE基于JAVA 技术,与平台无关. J2EE拥有开放标准,许多大型公司实现了对该规范支持的应用服务器.如BEA ,IBM,ORACLE等. J2EE提供相当 ...
编译原理--NFA/DFA
现成的, 讲义: https://www.cnblogs.com/AndyEvans/p/10240790.html https://www.cnblogs.com/AndyEvans/p/10241 ...
远程连接Linux相关操作
1.远程连接的步骤编译网卡配置文件,修改onboot参数 vi /etc/sysconfig/network-scripts/ifcfg-ens33进入命令之后将onboot改成onboot=yes ...

Xpath表达式的粗介绍

Xpath表达式的粗介绍的更多相关文章

随机推荐

热门专题