Python爬虫selenium中get_cookies()和add

在用selenium爬取网页的时候，有时候需要登陆，这时候用selenium获取cookie和携带cookie是很方便的，获取cookie可以通过内置的函数get_cookies()，它得到的是一组cookie,是由cookie组成的列表。单个的cookie是字典组成的，所有get_cookies()返回值是由字典组成的列表。

dictCookies = browser.get_cookies()

jsonCookies = json.dumps(dictCookies)

# print(jsonCookies)

with open('anquan.txt', 'w') as f:

f.write(jsonCookies)

注意：这个jsonCookies是一个列表，是一个完整的cookie。

{'name': 'QCARJSESSIONID', 'value': 'BBmPcsfClCknfQX1cN2MLMgKXZGtFWqsBvjN9mbM9tmbL38hMmw4!1426878101', 'path': '/', 'domain': 'qcar.apiins.com', 'secure': False, 'httpOnly': True}

{'name': 'BIGipServercar_qcar_poool', 'value': '1191316140.16671.0000', 'path': '/', 'domain': 'qcar.apiins.com', 'secure': False, 'httpOnly': False}

{'name': 'chinainsuranceJSESSIONID', 'value': 'rkgncsfG8pnrhh8x1CvNy46zHplyLkTjyv1LL2hk4wDrkD9Mjz9Y!2078734058', 'path': '/', 'domain': 'qcar.apiins.com', 'secure': False, 'httpOnly': True}

{'name': 'BIGipServercar_core_pool', 'value': '1191316140.17951.0000', 'path': '/', 'domain': 'qcar.apiins.com', 'secure': False, 'httpOnly': False}

这样就获取到了cookie,那么如何使用呢，我们让浏览器对象携带cookies就行了，这时候用另外一个函数add_cookie（）

with open('anquan.txt', 'r', encoding='utf8') as f:

listCookies = json.loads(f.read())

print('%%%%%%%%%%%%%%%%%', listCookies)

for cookie in listCookies:

obj.add_cookie(cookie)

obj.get('https://qcar.apiins.com/qcar')

# 读取完cookie刷新页面

obj.refresh()

这样，我们就可以携带cookie，实现免登陆。有人说，你直接登陆不就完事了吗？有些应用场景还是用的到的，比如说验证码识别率不高，比如监视爬虫，定时爬虫，要求五分钟爬一次，两分钟爬一次，每次登陆会很麻烦。这个时候我们可以分开，一个专门登陆抓取cookie，30分钟更新一次cookie文件。另外一个读取cookie文件就ok了。

Python爬虫selenium中get_cookies()和add_cookie（）的用法的更多相关文章

selenium中get_cookies()和add_cookie（）的用法
在用selenium爬取网页的时候,有时候需要登陆,这时候用selenium获取cookie和携带cookie是很方便的,获取cookie可以通过内置的函数get_cookies(),它得到的是一组c ...
[Python爬虫] Selenium爬取新浪微博客户端用户信息、热点话题及评论 (上)
转载自:http://blog.csdn.net/eastmount/article/details/51231852 一. 文章介绍源码下载地址:http://download.csdn.net/ ...
Python爬虫-selenium的使用（2）
使用selenium打开chrome浏览器百度进行搜索 12345678910111213141516171819202122232425 from selenium import webdriver ...
[Python爬虫] Selenium实现自动登录163邮箱和Locating Elements介绍
前三篇文章介绍了安装过程和通过Selenium实现访问Firefox浏览器并自动搜索"Eastmount"关键字及截图的功能.而这篇文章主要简单介绍如何实现自动登录163邮箱,同时 ...
[Python爬虫] Selenium获取百度百科旅游景点的InfoBox消息盒
前面我讲述过如何通过BeautifulSoup获取维基百科的消息盒,同样可以通过Spider获取网站内容,最近学习了Selenium+Phantomjs后,准备利用它们获取百度百科的旅游景点消息盒(I ...
python爬虫---selenium库的用法
python爬虫---selenium库的用法 selenium是一个自动化测试工具,支持Firefox,Chrome等众多浏览器在爬虫中的应用主要是用来解决JS渲染的问题. 1.使用前需要安装这个 ...
[python爬虫] Selenium常见元素定位方法和操作的学习介绍
这篇文章主要Selenium+Python自动测试或爬虫中的常见定位方法.鼠标操作.键盘操作介绍,希望该篇基础性文章对你有所帮助,如果有错误或不足之处,请海涵~同时CSDN总是屏蔽这篇文章,再加上最近 ...
[python爬虫] Selenium常见元素定位方法和操作的学习介绍(转载)
转载地址:[python爬虫] Selenium常见元素定位方法和操作的学习介绍一. 定位元素方法官网地址:http://selenium-python.readthedocs.org/locat ...
[Python爬虫] Selenium+Phantomjs动态获取CSDN下载资源信息和评论
前面几篇文章介绍了Selenium.PhantomJS的基础知识及安装过程,这篇文章是一篇应用.通过Selenium调用Phantomjs获取CSDN下载资源的信息,最重要的是动态获取资源的评论,它是 ...

随机推荐

Istio 1.4 更新了 | 感觉学不完
Istio 1.4 更新了官网 https://istio.io/news/2019/announcing-1.4/ Istio 评选为GitHub上增长最快的五个开源项目之一变更说明获取更改 ...
FusionInsight大数据开发---sorl应用开发
sorl应用开发要求: 了解Solr应用开发适用场景熟悉Solr应用开发流程熟悉并使用Solr常用API 理解Collection设计基本原则应用开发实践 Solr简介 Solr是一个高性能, ...
常用Java API之Ramdom--用代码模拟猜数小游戏
常用Java API之Ramdom Ramdom类用来生成随机数字.使用起来也是三个步骤: 1.导包 import java.util.Random; 2.创建 Random r = new Rand ...
reactiveX沉思(草稿)
一.第一性原理将异步的io.事件解释为observable.并借用observer的一些类概念进行处理. ReactiveX is a library for composing asynchron ...
NetCore 统一处理 webapi 返回null 转为“”
数据库中部分表字段允许空值,则代码中实体类对应的字段类型为可空类型Nullable<>,如int?,DateTime?,null值字段序列化返回的值都为null,前端对应字段赋值需要做nu ...
Java自学-接口与继承多态
Java的多态操作符的多态 +可以作为算数运算,也可以作为字符串连接类的多态父类引用指向子类对象示例 1 : 操作符的多态同一个操作符在不同情境下,具备不同的作用如果+号两侧都是整型,那么 ...
Springboot - java.lang.IllegalStateException: Failed to load property source from location 'classpath:/application.yml'
Caused by: org.yaml.snakeyaml.scanner.ScannerException: while scanning a simple key in 'reader', lin ...
2019-07-31 Jquery
Jquery是什么? jQuery是一个快速.简洁的JavaScript框架,是继Prototype之后又一个优秀的JavaScript代码库(或JavaScript框架).jQuery设计的宗旨是“ ...
django配置文件
1.BASSE_DIR BASE_DIR = os.path.dirname(os.path.dirname(os.path.abspath(__file__))) 当前工程的根目录,Django会依 ...
Python的object和type理解及主要对象层次结构
一.Object与Type 1.摘自Python Documentation 3.5.2的解释 Objects are Python’s abstraction for data. All data ...

Python爬虫selenium中get_cookies()和add_cookie（）的用法

Python爬虫selenium中get_cookies()和add_cookie（）的用法的更多相关文章

随机推荐

热门专题