selenium是大家众所周知的web自动化测试框架,主要用来完成web网站项目的自动化测试,但其实如果要实现一个web爬虫,去某些网站爬取数据,其实用selenium来实现也很方便. 比如,我们现在要实现一个这样的需求:打开百度-->输入拉钩-->找到拉钩链接,点击进入拉钩-->选择“全国”站-->输入岗位“自动化测试工程师”-->搜索-->爬取所有的自动化测试岗位信息 用selenium怎么实现呢? 基于chrome谷歌浏览器的自动化代码如下,每一步操作都加了注释标…
Selenium Web 自动化 - Selenium(Java)环境搭建 2016-07-29 1 下载JDK JDK下载地址:http://www.oracle.com/technetwork/java/javase/downloads/jdk8-downloads-2133151.html 2 安装和配置JDK 安装目录尽量不要有空格  D:\Java\jdk1.8.0_91; D:\Java\jre8 设置环境变量: “我的电脑”->右键->“属性”->”高级系统设置”->…
Selenium Web 自动化 - Selenium常用API 2016-08-01 目录 1 对浏览器操作  1.1 用webdriver打开一个浏览器  1.2 最大化浏览器&关闭浏览器  1.3 设置浏览器窗口大小  1.4 打开测试页面  1.5 处理浏览器弹出的新窗口2 页面元素定位3 如何对页面元素进行操作  3.1 WebElement相关方法  3.2 iFrame的处理  3.3 输入框(text field or textarea)  3.4 下拉选择框(Select) …
selenium安装介绍 selenium是web浏览器的自动化工具 官网:https://www.selenium.dev 构成: WebDriver: 浏览器提供的浏览器api来控制浏览器(模拟用户操作) IDE: 可以录制用户的操作(录制工具) Grd:分布式,可以在多个浏览器进行操作 selenium架构图 原理:在客户端(client)用不同的语言对selenium脚本进行编写-->将脚本传送给selenium服务器(driver)-->服务器调用相应的浏览器驱动来启动对应的浏览器并…
selenium各版本下载地址 http://selenium-release.storage.googleapis.com/index.html 国内下载:http://npm.taobao.org/mirrors/chromedriver ChromeDriver各版本下载地址 http://chromedriver.storage.googleapis.com/index.html Chrome各版本下载地址 https://www.chromedownloads.net/ 存放路径:Wi…
有的页面输入框自带默认值,想要修改里面的内容时,先使用clear()再send_keys(),这种方式无法清除只会在默认值后面追加内容,不是我想要的结果 解决方法: 方法一: 先双击,后直接send_keys(), 不用clear() ​ 缺陷: 双击不一定能选中所有内容 from selenium.webdriver.common.action_chains import ActionChains element = driver.find_element_by_xpath('xpath路径'…
使用Python写web-ui自动化脚本时,如果浏览器窗口比较小或者电脑屏幕比较小时, 可能会遇到页面元素的点击click()方法失效的问题,报错如下: Element <span>...</span> is not clickable at point (98, 299). Other element would receive the click 尝试过通过鼠标对象点击和键盘操作,都无法解决 这时候可以通过调用js来点击 js = 'document.querySelector…
1 Selenium Web 自动化 - Selenium(Java)环境搭建 2 Selenium Web 自动化 - 如何找到元素 3 Selenium Web 自动化 - Selenium常用API 4 Selenium Web 自动化 - 项目实战环境准备 5 Selenium Web 自动化 - 项目实战(一) 6 Selenium Web 自动化 - 项目实战(二) 7 Selenium Web 自动化 - 项目实战(三) 8 Selenium Web 自动化 - 项目持续集成 9…
撸主听说有个网站叫他趣,里面有个社区,其中有一项叫他趣girl,撸主点进去看了下,还真不错啊,图文并茂,宅男们自己去看看就知道啦~ 接下来当然就是爬取这些妹子的图片啦,不仅仅是图片,撸主发现里面的对话也很有意思,于是把对话也一并抓取下来好了. 那么问题来了,用什么工具呢?在之前的练习中已经用过urllib2,正则表达式匹配实在麻烦,这次来点稍微高级的,试试selenium: selenium是什么?其实它是一个web自动化测试的工具,运行起来就跟我们自己操作浏览器差不多,废话不多说,下面开始.…
欢迎大家前往腾讯云技术社区,获取更多腾讯海量技术实践干货哦~ 作者:陈象 导语: 最近写了好几个简单的爬虫,踩了好几个深坑,在这里总结一下,给大家在编写爬虫时候能给点思路.本次爬虫内容有:静态页面的爬取.动态页面的爬取.web自动化终极爬虫. 分析: 数据获取(主要靠爬虫) 静态网页爬取 动态网页爬取 数据存储(python excel存储) Python Excel操作,保存结果 数据获取实战: 百度音乐(静态网页) 分析步骤1 . 打开百度音乐:http://music.baidu.com/…