8-python模拟登入(无验证码)
方式:
1.手动登入,获取cookie
2.使用cookielib库 和 HTTPCookieProcessor处理器
#_*_ coding: utf-8 _*_ '''
Created on 2018年7月13日
@author: sss ''' import urllib.request
import urllib.request
import urllib.parse
import random
import ssl # url = 'https://www.ctguqmx.com/account/ajax/login_process/'
url = "http://www.ctguqmx.com/people/%E4%BD%99%E6%9D%BE" #表示忽视未经核实的ssl证书认证
context = ssl._create_unverified_context() #user-agent列表,每次请求随机选一个:
ua_list = [
"Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/67.0.3396.99 Safari/537.36",
"Mozilla/5.0 (Windows NT 10.0; WOW64; Trident/7.0; rv:11.0) like Gecko",
"Mozilla/5.0 (X11; CrOS i686 2268.111.0)like Gecko",
"Mozilla/5.0 (Macintosh; U; PPC Mac OS X ",
"Mozilla/5.0 (Macintosh; Intel Mac OS "
] user_agent = random.choice(ua_list) headers = {
'User_Agent' : user_agent,
'Cookie': 'mcb__Session=giq2h72grr3643fcobi88el8t4; Hm_lvt_bad1d0a80942d2554f202adea54e0555=1530434463,1530703915,1531411239,1531451926; mcb__user_login=2M7Kkb9knW5lU51m2dae05ejlZ6Vw45dR-3NFgP1gm2Q1cem1bDVqJWQv2SZlZyTmWiVaJWeZ2SbkWRmyZuTZZXHx2XGncyYaWqbnA..; Hm_lpvt_bad1d0a80942d2554f202adea54e0555=1531452044If-Modified-Since: Fri, 13 Jul 2018 03:39:06 GMT'
} formdata = {
"user_name" : "name",
"password" : "password"
}
data = urllib.parse.urlencode(formdata).encode(encoding='utf_8') request = urllib.request.Request(url, headers = headers, data = data) response = urllib.request.urlopen(request, context = context) print(response.read()) print('finish!')
#_*_ coding: utf-8 _*_
'''
Created on 2018年7月14日
@author: sss
function: 用账号登入qmx,爬去个人页面 ''' import urllib
import http.cookiejar #构建一个CookieJar对象实例来保存cookie
cookiejar = http.cookiejar.CookieJar() #使用HTTPCookieProcessor()来创建cookie处理器对象,参数为CookieJar()对象的值
Handler = urllib.request.HTTPCookieProcessor(cookiejar) #构建opener
opener = urllib.request.build_opener(Handler) #addheaders 接受一个列表,里面每个元素都是一个headers信息的元组,opener将附带headers信息
opener.addheaders = [('User-Agent', "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/54.0.2840.99 Safari/537.36")] #需要登入密码和账户
data = {
"user_name" : "name",
"password" : "password"
} #data转码
postdata = urllib.parse.urlencode(data).encode(encoding='utf_8') #url
url = 'https://www.ctguqmx.com/account/ajax/login_process/' #构建request请求对象,包含要发送的数据
request = urllib.request.Request(url, data = postdata) #以get方法访问页面访问之后会自动保存cookie到cookiejar中
f = opener.open(request) #网址后面必须要有/ print(f.read().decode('utf-8'))
print('访问登入后界面:') #个人主页的urL
url = 'https://www.ctguqmx.com/people/xxxxxxxx' #x换成自己的 #opener包含用户登入后的cookie值,可以直接访问登入后的页面
response = opener.open(url)
html = response.read() with open('qmx_ys_person.html', 'wb+') as f:
f.write(html)
# print(html)
print('个人界面下载完毕!') response = opener.open('http://210.42.38.26:84/jwc_glxt/Login.aspx?xttc=1')
print('finish!')
8-python模拟登入(无验证码)的更多相关文章
- Python爬虫-尝试使用人工和OCR处理验证码模拟登入
刚开始在网上看别人一直在说知乎登入首页有有倒立的汉字验证码,我打开自己的知乎登入页面,发现只有账号和密码,他们说的倒立的验证码去哪了,后面仔细一想我之前登入过知乎,应该在本地存在cookies,然后我 ...
- vuex存取token,http简单封装、模拟登入权限校验操作、路由懒加载的几种方式、vue单页设置title
1.config index.js下面的跨域代理设置: proxyTable: { '/api': { target: 'http://xxxx', //要访问的后端接口 changeOrigin: ...
- SpringMVC单元测试之MockMVC,模拟登入用户
今天介绍一下springMVC的单元测试,可以参考spring官方文档进行 前提准备,springmvc的demo工程,这里就不做叙述了 pom.xml [html] view plain copy ...
- python模拟艺龙网登录带验证码输入
1.使用urllib与urllib2包 2.使用cookielib自动管理cookie 3.360浏览器F12抓信息 登录请求地址和验证码地址都拿到了如图 # -*- coding: utf-8 -* ...
- python模拟网站登陆-滑动验证码
普通滑动验证 以http://admin.emaotai.cn/login.aspx为例这类验证码只需要我们将滑块拖动指定位置,处理起来比较简单.拖动之前需要先将滚动条滚动到指定元素位置. impor ...
- 模拟登入教务处(header)
import HTMLParser import urlparse import urllib import urllib2 import cookielib import string import ...
- 网络爬虫之requests模块的使用+Github自动登入认证
本篇博客将带领大家梳理爬虫中的requests模块,并结合Github的自动登入验证具体讲解requests模块的参数. 一.引入: 我们先来看如下的例子,初步体验下requests模块的使用: ...
- pyppeteer硬钢掉淘宝登入的滑块验证
完整代码我也不好公布,我可以给你们思路,以及部分代码动动脑子看看文档应该也能搞定 一.初始化Chromium浏览器相关属性 browser = await pyppeteer.launch({'hea ...
- Python爬虫笔记【一】模拟用户访问之提交表单登入—第二次(7)
在第一次登入时遇到这个问题,页面验证码与下载下来需要识别的验证码不同的问题,从网上查寻说是叫验证码同步问题.发现是用cookie解决的,那次cookie介绍到通过cookie就可以实现时间戳同步问题, ...
随机推荐
- Python学习系列(六)(模块)
Python学习系列(六)(模块) Python学习系列(五)(文件操作及其字典) 一,模块的基本介绍 1,import引入其他标准模块 标准库:Python标准安装包里的模块. 引入模块的几种方式: ...
- 在PHP中对查询出得数据库数据进行json编码
select.php <?php $con = mysql_connect("localhost","Thh","920920thh" ...
- jinja2的一些用法
1.split用法以及乘法运算 {% set user_list=l.users.split(',') %} <tr> <td>{{ l.name }}</td> ...
- 【转】JMeter基础之——一个简单的性能测试
上一节中,我们了解了jmeter的一此主要元件,那么这些元件如何使用到性能测试中呢.这一节创建一个简单的测试计划来使用这些元件.该计划对应的测试需求. 1)测试目标网站是fnng.cnblogs.co ...
- java图形用户界面添加图片的代码
package com.aa; import java.awt.Component; import javax.swing.ImageIcon; import javax.swing.JPanel; ...
- split的用法回顾,快忘记了@ →@
split:用for循环时不要忘记是数组名.length package com.aaa; //split的用法把指定的字符串按指定的分割符进行分割,然后返回字符串 数组 public class f ...
- 2017中国大学生程序设计竞赛 - 女生专场(dp)
Building Shops Time Limit: 2000/1000 MS (Java/Others) Memory Limit: 131072/131072 K (Java/Others) To ...
- 字符编码py2,py3操作,SecureCRT的会话编码的设置
对之前的字符串类型和二进制类型(bytes类型),可以这样关联记忆,把字符串类型当作是Unicode,把bytes类型当作是GBK或者UTF-8或者是日文编码.这样字符串要转成二进制,那么就需要编码e ...
- python开发socket套接字:套接字&通信循环&链接循环&模拟远程命令
一,套接字 先从服务器端说起.服务器端先初始化Socket,然后与端口绑定(bind),对端口进行监听(listen),调用accept阻塞,等待客户端连接.在这时如果有个客户端初始化一个Socket ...
- Docker -- resolve "join node timeout" error
在worker节点机器上通过docker swarm join 到 manger node时,报Timeout错误,如下: Error response from daemon: Timeout wa ...