Python爬虫selenium、PhanmJs

selenium：可以模拟鼠标进行一些操作

实例1:实现自动打开google浏览器，进行百度搜索，并关闭浏览器

from selenium import webdriver

from time import sleep

#指定安装google浏览器驱动程序

bro = webdriver.Chrome(r'E:\Spider爬虫视频\day03\chromedriver_win32\chromedriver.exe')

#打开浏览器发起请求

bro.get('https://www.baidu.com')

sleep(2)

#定位到搜索框

my_text = bro.find_element_by_id('kw')

#向搜索框中输入一个关键字

my_text.send_keys('西红柿首富')

sleep(5)

#定位到搜索按钮

my_button = bro.find_element_by_id('su')

my_button.click()

sleep(6)

#关闭浏览器

bro.quit()

PhanmJs：无界面浏览器

from selenium import webdriver

from time import sleep

#指定phantomjs驱动

bro = webdriver.PhantomJS(r'E:\Spider爬虫视频\day03\phantomjs-2.1.1-windows\bin\phantomjs.exe')

#打开浏览器发起请求

bro.get('https://www.baidu.com')

bro.save_screenshot('./首页.png')#用来截屏

sleep(2)

#定位到搜索框

my_text = bro.find_element_by_id('kw')

#向搜索框中输入一个关键字

my_text.send_keys('人民币')

bro.save_screenshot('./2.png')

sleep(2)

#定位到搜索按钮

my_button = bro.find_element_by_id('su')

my_button.click()

sleep(5)

bro.save_screenshot('./3.png')

#关闭浏览器

bro.quit()

Python爬虫selenium、PhanmJs的更多相关文章

[Python爬虫] Selenium实现自动登录163邮箱和Locating Elements介绍
前三篇文章介绍了安装过程和通过Selenium实现访问Firefox浏览器并自动搜索"Eastmount"关键字及截图的功能.而这篇文章主要简单介绍如何实现自动登录163邮箱,同时 ...
[Python爬虫] Selenium+Phantomjs动态获取CSDN下载资源信息和评论
前面几篇文章介绍了Selenium.PhantomJS的基础知识及安装过程,这篇文章是一篇应用.通过Selenium调用Phantomjs获取CSDN下载资源的信息,最重要的是动态获取资源的评论,它是 ...
[Python爬虫] Selenium获取百度百科旅游景点的InfoBox消息盒
前面我讲述过如何通过BeautifulSoup获取维基百科的消息盒,同样可以通过Spider获取网站内容,最近学习了Selenium+Phantomjs后,准备利用它们获取百度百科的旅游景点消息盒(I ...
[Python爬虫] Selenium爬取新浪微博客户端用户信息、热点话题及评论 (上)
转载自:http://blog.csdn.net/eastmount/article/details/51231852 一. 文章介绍源码下载地址:http://download.csdn.net/ ...
python爬虫---selenium库的用法
python爬虫---selenium库的用法 selenium是一个自动化测试工具,支持Firefox,Chrome等众多浏览器在爬虫中的应用主要是用来解决JS渲染的问题. 1.使用前需要安装这个 ...
[python爬虫] Selenium常见元素定位方法和操作的学习介绍
这篇文章主要Selenium+Python自动测试或爬虫中的常见定位方法.鼠标操作.键盘操作介绍,希望该篇基础性文章对你有所帮助,如果有错误或不足之处,请海涵~同时CSDN总是屏蔽这篇文章,再加上最近 ...
[python爬虫] Selenium常见元素定位方法和操作的学习介绍(转载)
转载地址:[python爬虫] Selenium常见元素定位方法和操作的学习介绍一. 定位元素方法官网地址:http://selenium-python.readthedocs.org/locat ...
Python爬虫-selenium的使用（2）
使用selenium打开chrome浏览器百度进行搜索 12345678910111213141516171819202122232425 from selenium import webdriver ...
[Python爬虫] Selenium自动访问Firefox和Chrome并实现搜索截图
前两篇文章介绍了安装,此篇文章算是一个简单的进阶应用吧!它是在Windows下通过Selenium+Python实现自动访问Firefox和Chrome并实现搜索截图的功能. [Pyth ...
[python爬虫] Selenium定向爬取海量精美图片及搜索引擎杂谈
我自认为这是自己写过博客中一篇比较优秀的文章,同时也是在深夜凌晨2点满怀着激情和愉悦之心完成的.首先通过这篇文章,你能学到以下几点: 1.可以了解Python简单爬取图片的一些思路和方法 ...

随机推荐

OpenSSL中关于RSA_new和RSA_free的内存泄漏
这个具体的问题问题代码如下: RSA *rsaKey=RSA_new(); rsaKey = RSA_generate_key(keyBits,,NULL,NULL); RSA_free(rsaKey ...
Android 第三方库导致jar包冲突解决办法
这几天的任务是将mapbox的工程合到程序中去,但是合并过程却出现了问题合并方法: 在app的build.gradle中添加 dependencies { compile ('com.mapbox. ...
linux配置tomcat已service方式启动
1. 在/etc/init.d目录下新建文件,命名为tomcat2. 对tomcat文件进行编辑,执行 # cd /etc/init.d/ # vi tomcat 将下面代码粘上去注意:下面代码ja ...
python基础教程总结6——类
1. 如何定义一个类在进行python面向对象编程之前,先来了解几个术语:类,类对象,实例对象,属性,函数和方法. 类是对现实世界中一些事物的封装,定义一个类可以采用下面的方式来定义: class ...
EditPlus 3.7激活码注册码
EditPlus3.7激活教程以及EditPlus3.7激活码使用方法 EditPlus是一款功能齐全的文字编辑器,搭配其他的插件还可以实现很多的功能,还可以编辑和编译Java,调试程序等,主要用来打 ...
导入文件服务器报错，有可能是开发时候是window 服务器是linux，两个系统的文件系统的/和\是相反的，要注意这块
导入文件服务器报错,有可能是开发时候是window 服务器是linux,两个系统的文件系统的/和\是相反的,要注意这块
python_96_类的继承1
#面向对象3大特性:封装,多态,继承 # 继承可节省内存,减少代码 class People(): def __init__(self,name,age): self.Name=name self.A ...
python之道08
1.有如下文件,a1.txt,里面的内容为: 某某是最好的学校, 全心全意为学生服务, 只为学生未来,不为牟利. 我说的都是真的.哈哈分别完成以下的功能: a,将原文件全部读出来并打印. 答案 f ...
PAT (Basic Level) Practise （中文）- 1013. 数素数 (20)
http://www.patest.cn/contests/pat-b-practise/1013 令Pi表示第i个素数.现任给两个正整数M <= N <= 104,请输出PM到PN的所有 ...
01_2_Namespace命名空间
01_2_Namespace命名空间 1. Namespace_命名空间 namespace决定了action的访问路径,默认为””,可以接收所有路径的action namespace可以写为/,或者 ...

Python爬虫selenium、PhanmJs

Python爬虫selenium、PhanmJs的更多相关文章

随机推荐

热门专题