Python3爬虫登录模拟

使用Python爬虫登录系统之后，能够实现的操作就多了很多，下面大致介绍下如何使用Python模拟登录。

我们都知道，在前端的加密验证，只要把将加密环境还原出来，便能够很轻易地登录。

首先分析登录的步骤，通过审查元素得知

<input type="button" id="login" name="login" class="login" onclick="Logon();" value="登录">

点击按钮触发Logon()函数，然后查找Logon()函数定义

function Logon() {

}

函数定义内容各有不同，一般里面包含一些加密的操作，一般是使用写好的js加密。我们所需要做的便是重复这些步骤，加密数据。

对于加密，有三种方法：

第一，如果加密方法是base64之类的，可以直接用Python3的base64库加密；

第二，手动模仿；

第三，直接调用js加密，需要先下载PyExecJS，有的电脑需要先安装js的运行环境，比如Node.js。使用方法如下：

newusername = execjs.compile(content).call('base64encode', username)

其中content是js内容，base64encode是方法，username是参数，newusername是加密后的数据。

对于验证码的问题，先介绍下一般的图片验证码，可以请求获取验证码的地址，session之类的数据自己搞定，一般便可以请求成功，可以存到本地手动输入，也可以使用识别的第三方模块，但这个识别效果并不是很好。

然后，便是查看session，cookie。

接下来的操作就是构造请求头headers，这个可以自行去控制台查看或者使用wireshark， fiddler之类的抓包软件查看。

最后便可以请求数据：

使用

 s = requests.Session()

 s.headers.update(headers)

 r = s.post(url, data = params)

或者：

  r = requests.get(url, headers = headers, data = params)

headers是你构造的请求头，url是你请求的网站，params是加密的数据。

Python3爬虫登录模拟的更多相关文章

【Python3爬虫】模拟实现小牛在线登录过程
一.站点分析小牛在线的登录入口地址为:https://www.xiaoniu88.com/user/login. 用户登录时除了需要输入用户名和密码,还要输一个验证码.我们可以先任意输入一个用户名. ...
Python爬虫之模拟登录微信wechat
不知何时,微信已经成为我们不可缺少的一部分了,我们的社交圈.关注的新闻或是公众号.还有个人信息或是隐私都被绑定在了一起.既然它这么重要,如果我们可以利用爬虫模拟登录,是不是就意味着我们可以获取这些信息 ...
第三百三十三节，web爬虫讲解2—Scrapy框架爬虫—Scrapy模拟浏览器登录—获取Scrapy框架Cookies
第三百三十三节,web爬虫讲解2—Scrapy框架爬虫—Scrapy模拟浏览器登录模拟浏览器登录 start_requests()方法,可以返回一个请求给爬虫的起始网站,这个返回的请求相当于star ...
Python爬虫-百度模拟登录（二）
上一篇-Python爬虫-百度模拟登录(一) 接上一篇的继续参数 codestring codestring jxG9506c1811b44e2fd0220153643013f7e6b1898075 ...
python3爬虫系列19之反爬随机 User-Agent 和 ip代理池的使用
站长资讯平台:python3爬虫系列19之随机User-Agent 和ip代理池的使用我们前面几篇讲了爬虫增速多进程,进程池的用法之类的,爬虫速度加快呢,也会带来一些坏事. 1. 前言比如随着我们爬虫 ...
python3爬虫（4）各种网站视频下载方法
python3爬虫(4)各种网站视频下载方法原创H-KING 最后发布于2019-01-09 11:06:23 阅读数 13608 收藏展开理论上来讲只要是网上(浏览器)能看到图片,音频,视频,都能够 ...
Python3爬虫系列：理论+实验+爬取妹子图实战
Github: https://github.com/wangy8961/python3-concurrency-pics-02 ,欢迎star 爬虫系列: (1) 理论 Python3爬虫系列01 ...
python3爬虫中文乱码之请求头‘Accept-Encoding’：br 的问题
当用python3做爬虫的时候,一些网站为了防爬虫会设置一些检查机制,这时我们就需要添加请求头,伪装成浏览器正常访问. header的内容在浏览器的开发者工具中便可看到,将这些信息添加到我们的爬虫代码 ...
python3爬虫之开篇
写在前面的话: 折腾爬虫也有一段时间了,从一开始的懵懵懂懂,到现在的有一定基础,对于这一路的跌跌撞撞,个人觉得应该留下一些文字性的东西,毕竟好记性不如烂笔头,而且毕竟这是吃饭的家伙,必须用心对待才可以 ...

随机推荐

201521123011《Java程序设计》第12周学习总结
1. 本周学习总结 1.1 以你喜欢的方式(思维导图或其他)归纳总结多流与文件相关内容. 2. 书面作业将Student对象(属性:int id, String name,int age,doubl ...
JAVA课程设计-----加减法测试博客
1.团队成员介绍(一个人做的) 谢季努:网络1513 201521123079 2.项目git地址 3.项目git提交截图 4.项目运行截图输入答案后点击确认就会出现本次的得分如果觉得成绩不理想点 ...
Markdown例
一个例子: 例子开始 1. 本章学习总结今天主要学习了三个知识点封装继承多态 2. 书面作业 Q1. java HelloWorld命令中,HelloWorld这个参数是什么含义? 今天学了一 ...
多线程面试题系列（7）：经典线程同步互斥量Mutex
前面介绍了关键段CS.事件Event在经典线程同步问题中的使用.本篇介绍用互斥量Mutex来解决这个问题. 互斥量也是一个内核对象,它用来确保一个线程独占一个资源的访问.互斥量与关键段的行为非常相似, ...
Windows下chm转换为html的超简单方法
摘要:通过调用Windows命令,将chm 文件转换为html 文件概述:很多程序员朋友都会遇到这样的问题,看一个离线版的帮助文档(chm文件),总会产生一个索引文件(该文件的chw文件), 而且有 ...
Dodobox一个基于所有平台的嵌入式操作系统（OS）
DodoBox是为广大应用开始者提供的一个跨平台应用发布平台.它提供了客户端和服务器端的SDK及详细的开发者帮助文件,帮助开发者创建.移植软件应用或游戏应用. DodoBox基于OpenGL技术,提供 ...
htt p第一章概述
http的概述 1 web客户端与服务器是如何通信 2 web资源来自的何方 3 web事务是怎样的工作的 4 http通信所使用的报文结构 5 底层tcp的传输的结构 6不同的http协议体什么是 ...
java实现excel和数据的交互
1. 环境要求本文环境为: 数据库为oracle,jdk为jdk7,依赖jar包为ojdbc6-11.2.0.4.0.jar+poi-3.14.jar 2.POI 使用 1. 建立工作空间 2. 获 ...
oracle pctfree和pctused 详解
一.建立表时候,注意PCTFREE参数的作用 PCTFREE:为一个块保留的空间百分比,表示数据块在什么情况下可以被insert,默认是10,表示当数据块的可用空间低于10%后,就不可以被insert ...
Hibernate中的实体映射
一.一对一映射如人(Person)与身份证(IdCard) 的关系,即为一对一的关系,一个人只能有一张身份证,一张身份证只能属于某一个人,它们的关系图如下图所示: 在Person实体中添加一个属 ...

Python3爬虫登录模拟

Python3爬虫登录模拟的更多相关文章

随机推荐

热门专题