爬虫学习之-xpath

1、XPATH使用方法

使用XPATH有如下几种方法定位元素（相比CSS选择器，方法稍微多一点）：

a、通过绝对路径定位元素（不推荐！）

WebElement ele = driver.findElement(By.xpath("html/body/div/form/input"));

b、通过相对路径定位元素

WebElement ele = driver.findElement(By.xpath("//input"));

c、使用索引定位元素

WebElement ele = driver.findElement(By.xpath("//input[4]"));

d、使用XPATH及属性值定位元素

WebElement ele = driver.findElement(By.xpath("//input[@id='fuck']"));

//其他方法(看字面意思应该能理解吧)

WebElement ele = driver.findElement(By.xpath("//input[@type='submit'][@name='fuck']"));

WebElement ele = driver.findElement(By.xpath("//input[@type='submit' and @name='fuck']"));

WebElement ele = driver.findElement(By.xpath("//input[@type='submit' or @name='fuck']"));

e、使用XPATH及属性名称定位元素
   元素属性类型：@id 、@name、@type、@class、@tittle

//查找所有input标签中含有type属性的元素

WebElement ele = driver.findElement(By.xpath("//input[@type]"));

f、部分属性值匹配

WebElement ele = driver.findElement(By.xpath("//input[start-with(@id,'fuck')]"));//匹配id以fuck开头的元素，id='fuckyou'

WebElement ele = driver.findElement(By.xpath("//input[ends-with(@id,'fuck')]"));//匹配id以fuck结尾的元素，id='youfuck'

WebElement ele = driver.findElement(By.xpath("//input[contains(@id,'fuck')]"));//匹配id中含有fuck的元素，id='youfuckyou'

g、使用任意值来匹配属性及元素

WebElement ele = driver.findElement(By.xpath("//input[@*='fuck']"));//匹配所有input元素中含有属性的值为fuck的元素

元素定位总结

//注：本专题只介绍java版

//By id

WebElement ele = driver.findElement(By.id());

//By Name

WebElement ele = driver.findElement(By.id());

//By className

WebElement ele = driver.findElement(By.className());

//By tabName

WebElement ele = driver.findElement(By.tagName());

//By linkText

WebElement ele = driver.findElement(By.linkText());

//By partialLinkText

WebElement ele = driver.findElement(By.partialLinkText());//通过部分文本定位连接

//By cssSelector

WebElement ele = driver.findElement(By.cssSelector());

//By XPATH

WebElement ele = driver.findElement(By.xpath());

=================================栗子=====================================

1、id 获取id 的属性值

2、starts-with 顾名思义，匹配一个属性开始位置的关键字 -- 模糊定位

3、contains 匹配一个属性值中包含的字符串 -- 模糊定位

4、text() 函数文本定位

5、last() 函数位置定位

<input id="su" class="bg s_btn btnhover" value="百度一下" type="submit"/>

//*[@id='su']      获取id 的属性为'su' 的值
或
//input[contains(@class,'bg s_btn')]

<a class="lb" href="https://passport.baidu.com/v2/?login&tpl=mn&u=http%3A%2F%2Fwww.baidu.com%2F" name="tj_login" onclick="return false;">登录</a>

//a[starts-with(@name,'tj_lo')]     属性模糊定位
//a[contains(@name,'tj_lo')]     属性模糊定位

<a href="http://www.baidu.com">百度搜索</a>

//a[text()='百度搜索']

或

//a[contains(text(),"搜索")]    --文本模糊定位

<a id="setf" href="//www.baidu.com/cache/sethelp/help.html" onmousedown="return ns_c({'fm':'behs','tab':'favorites','pos':0})" target="_blank">把百度设为主页</a>

//a[text()='把百度设为主页']

/A/B/C[last()]   表示A元素→B元素→C元素的最后一个子元素，得到id值为e2的E元素

爬虫学习之-xpath的更多相关文章

python爬虫学习之XPath基本语法
XPath 使用路径表达式来选取 XML 文档中的节点或节点集.节点是通过沿着路径(path)或者步(steps)来选取的. XML实例文档我们将在下面的例子中使用这个XML文档. <?xml ...
爬虫学习之基于Scrapy的爬虫自动登录
###概述在前面两篇(爬虫学习之基于Scrapy的网络爬虫和爬虫学习之简单的网络爬虫)文章中我们通过两个实际的案例,采用不同的方式进行了内容提取.我们对网络爬虫有了一个比较初级的认识,只要发起请求获 ...
爬虫学习之基于Scrapy的网络爬虫
###概述在上一篇文章<爬虫学习之一个简单的网络爬虫>中我们对爬虫的概念有了一个初步的认识,并且通过Python的一些第三方库很方便的提取了我们想要的内容,但是通常面对工作当作复杂的需求 ...
scrapy爬虫学习系列二：scrapy简单爬虫样例学习
系列文章列表: scrapy爬虫学习系列一:scrapy爬虫环境的准备: http://www.cnblogs.com/zhaojiedi1992/p/zhaojiedi_python_00 ...
爬虫之BS&Xpath
BeautifulSoup 一简介简单来说,Beautiful Soup是python的一个库,最主要的功能是从网页抓取数据.官方解释如下: ''' Beautiful Soup提供一些简单的.p ...
爬虫——BeautifulSoup和Xpath
爬虫我们大概可以分为三部分:爬取——>解析——>存储一 Beautiful Soup: Beautiful Soup提供一些简单的.python式的函数用来处理导航.搜索.修改分析树等功 ...
爬虫学习（二）--爬取360应用市场app信息
欢迎加入python学习交流群 667279387 爬虫学习爬虫学习(一)-爬取电影天堂下载链接爬虫学习(二)–爬取360应用市场app信息代码环境:windows10, python 3.5 ...
python爬虫学习05-爬取图片
python爬虫学习05-爬取图片确定要爬取的网址:https://shenan.tuchong.com/20903415/#image309854686 要爬取的内容:使用浏览器插件xpath对图 ...
python爬虫学习(1) —— 从urllib说起
0. 前言如果你从来没有接触过爬虫,刚开始的时候可能会有些许吃力因为我不会从头到尾把所有知识点都说一遍,很多文章主要是记录我自己写的一些爬虫所以建议先学习一下cuiqingcai大神的 Pyth ...

随机推荐

laravel5实现微信第三方登录功能
背景最近手头一个项目需要实现用户在网站的第三方登录(微信和微博),后端框架laravel5.4. 实现过程以微信网页版第三方登录,其他于此类似,在此不做重复. 准备工作网站应用微信登录是基于OAu ...
android一个下拉放大库bug的解决过程及思考
android一个下拉放大库bug的解决过程及思考起因项目中要做一个下拉缩放图片的效果,搜索了下github上面,找到了两个方案. https://github.com/Frank-Zhu/Pul ...
[Golang学习笔记] 01 工作区和GOPATH
Go语言3个环境变量: GOROOT:GO语言按照根路径,也就是GO语言的安装路径. GOPATH:若干工作区目录的路径.是我自己定义的工作空间. GOBIN:GO程序生成的可执行文件(executa ...
数据结构与算法之数组（1）——in dart
import 'dart:math' show Random; List<int> _array; final _rnd = Random(); final _capacity = 100 ...
关于 idea 快捷键 alt + f7 无法使用的一些尝试
1. 概述问题使用 idea 时, 快捷键 alt + f7 无法生效环境 OS: win10 idea: idea 2018.1.5 GeForce Experience: 3.17.0.12 ...
20155203 实验二《Java面向对象程序设计》实验报告
20155203 实验二<Java面向对象程序设计>实验报告一.实验内容参考http://www.cnblogs.com/rocedu/p/6371315.html#SECUNITTE ...
20155233 《Java程序设计》实验四 Android开发基础
20155233 <Java程序设计>实验四 Android开发基础实验内容 1.基于Android Studio开发简单的Android应用并部署测试; 2.了解Android组件.布 ...
20155319 2017-2018-1《信息安全系统设计》第四周课堂测试、Makefile、myod
20155319 2017-2018-1<信息安全系统设计>第四周课堂测试.Makefile.myod 测试2-gcc测试 1.用gcc 进行预处理,编译,汇编,链接vi输入的代码 2.生 ...
20155332 2016-2017-2《Java程序设计》第1周学习总结
# 20155332 2016-2017-2<Java程序设计>第1周学习总结教材学习内容总结课本提问 1.Java平台概论:为什么需要Java程序设计语言? 2.Java平台概论:版 ...
install netcdf
https://gist.github.com/perrette/cd815d03830b53e24c82

爬虫学习之-xpath

爬虫学习之-xpath的更多相关文章

随机推荐

热门专题