selenium,webdriver模仿浏览器访问百度基础1

这是一种比较好的反反爬技术

#安装：pip install selenium=2.48.0

#显示：pip show selenium

#卸载：pip uninstall selenium

#模拟用户行为

from selenium import webdriver

import os

import time

from selenium import common

#生成一个浏览器对象

driver = webdriver.PhantomJS()

#访问

driver.get('http://www.baidu.com/')

#创建文件夹存放数据

root_dir = 'baidu'

if not os.path.exists(root_dir):

    os.mkdir(root_dir)

#存储的文件夹及命名的文件名

file_name = root_dir + '/homepage.png'

#截屏并保存图片

driver.save_screenshot(file_name)

#模拟用户行为操作

timeout = 4

count = 0

#输入行为

while True:

    #只进行访问四次  访问不成功就终止

    if count > 4:

        break

    try:

        #通过id号找到百度的输入框

        obj = driver.find_element_by_id('kw')

        #在找到的输入框中 输入文字

        obj.send_keys(u'章丘铁锅')

        print(obj)

        break

    except common.exceptions.NoSuchElementException as e:

        print(e)

        #报错后 等待4秒 再次访问

        time.sleep(timeout)

        count += 1

#存储的文件夹及命名的文件名

file_name = root_dir + '/homepage_zhangqiutieguo.png'

#截屏并保存图片

driver.save_screenshot(file_name)

#模拟鼠标点击操作

#通过id号找到点击按钮

su = driver.find_element_by_id('su')

#点击

su.click()

#等到4秒 等页面加载完成

time.sleep(4)

#存储的文件夹及命名的文件名

file_name = root_dir + '/homepage_search.png'

#截屏并保存图片  运行后就可以看到 相当于在百度输入章丘铁锅后的页面  想想都很激动呢

driver.save_screenshot(file_name)

selenium,webdriver模仿浏览器访问百度基础1的更多相关文章

selenium,webdriver模仿浏览器访问百度基础2
学python理念 : 代码要多敲一定要多敲哪怕很基础注释要清晰由于基础1有一些注释写的很详细, 在这里有些注释没有写的很详细可以配合基础1一起学习哦 from selenium im ...
python selenium webdriver处理浏览器滚动条
用键盘右下角的UP,DOWN按键来处理页面滚动条这种方法很灵活用起来很方便!!!! from selenium import webdriver import time from selenium. ...
用webdriver模仿浏览器爬取豆瓣python书单
用webdriver模仿浏览器爬取豆瓣python书单其中运用到os 模块作用是生成文件夹存储爬取的信息 etree 用于xpath解析内容详细代码如下可用我的上一篇博客存取到excel当 ...
selenium WebDriver 对浏览器标签页的切换
关于selenium WebDriver 对浏览器标签页的切换,现在的市面上最新的浏览器,当点击一个链接打开一个新的页面都是在浏览器中打开一个标签页,而selenium只能对窗口进行切换的方法,只能操 ...
selenium webdriver(1)---浏览器操作
启动浏览器如何启动浏览器已在上篇文章中说明,这里还是以chrome为例,firefox.IE启动方式相同. //启动浏览器 import org.openqa.selenium.WebDriver; ...
Java环境下 selenium webDriver + chrome浏览器搭建与调试
一.首先下载selenium webDriver jar包,下载地址如下: http://selenium-release.storage.googleapis.com/index.html 二.下载 ...
基于Python, Selenium, Phantomjs无头浏览器访问页面
引言: 在自动化测试以及爬虫领域,无头浏览器的应用场景非常广泛,本文将梳理其中的若干概念和思路,并基于代码示例其中的若干使用技巧. 1. 无头浏览器通常大家在在打开网页的工具就是浏览器,通过界面上输 ...
使用python selenium webdriver模拟浏览器
selenium是进行web自动化测试的一个工具,支持C,C++,Python,Java等语言,他能够实现模拟手工操作浏览器,进行自动化,通过webdriver驱动浏览器操作,我使用的是chrome浏 ...
selenium webdriver处理浏览器Cookie
有时候我们需要验证浏览器中是否存在某个cookie,因为基于真实的cookie 的测试是无法通过白盒和集成测试完成的.WebDriver 提供了操作Cookie 的相关方法可以读取.添加和删除cook ...

随机推荐

牛逼哄哄的 API 网关是什么鬼？面试必问！
Java技术栈 www.javastack.cn 优秀的Java技术公众号作者:aCoder2013 github.com/aCoder2013/blog/issues/35 前言假设你正在开发一 ...
洛谷 P3368 【模板】树状数组 2（区间加，单点查询）
题目链接 https://www.luogu.org/problemnew/show/P3368 树状数组最基础的用法:https://www.cnblogs.com/yinyuqin/p/1096 ...
HDU Stealing Harry Potter's Precious（状压BFS）
状压BFS 注意在用二维字符数组时,要把空格.换行处理好. #include<stdio.h> #include<algorithm> #include<string.h ...
ajax请求超时解决方案
设置timeout的时间,通过检测complete时status的值判断请求是否超时,如果超时执行响应的操作. var ajaxTimeoutTest=$.ajax({ url:'',//请求地址 t ...
记录混合APP开发遇到的坑！！
1.在IOS中给body绑定click事件会失效 2.在IOS中<div contenteditable="true"></div>中点击时可以弹出键盘但是 ...
elasticsearch 基础 —— Common Terms Query常用术语查询
常用术语查询该common术语查询是一个现代的替代提高了精确度和搜索结果的召回(采取禁用词进去),在不牺牲性能的禁用词. 问题查询中的每个术语都有成本.搜索"The brown fox& ...
python车牌精确定位
#coding=utf-8 import cv2 # 使用的是HyperLPR已经训练好了的分类器 watch_cascade = cv2.CascadeClassifier('model/casca ...
rtp/rtcp
rtp/rtcp stack custom rtp ORTP UCL Common RTP library Bell Labs RTP Library jrtplib 1.custom rtp sen ...
RabbitMQ数据同步一致性解决方案
1.概述我们知道在使用RabbitMQ时,生产者将消息发布出去之后,消息是否顺利到达broker代理服务器呢?默认情况下发布操作没有任何信息返回给生产者,也就是生产者是不知道消息有没有顺利到达bro ...
Android kotlin静态属性、静态方法
只需要用 companion object 包裹相应代码块即可.以静态属性为例: class Constants { companion object { val BASE_URL = "h ...

selenium,webdriver模仿浏览器访问百度 基础1

selenium,webdriver模仿浏览器访问百度 基础1的更多相关文章

随机推荐

热门专题

selenium,webdriver模仿浏览器访问百度基础1

selenium,webdriver模仿浏览器访问百度基础1的更多相关文章