【Python爬虫】教务处模拟登陆

Python2模拟登陆获取cookie

import urllib

import urllib2

import cookielib

filename = 'cookie.txt'

#声明一个MozillaCookieJar对象实例来保存cookie，之后写入文件

cookie = cookielib.MozillaCookieJar(filename)

opener = urllib2.build_opener(urllib2.HTTPCookieProcessor(cookie))

#设置请求参数

values = {}

values['__VIEWSTATE'] = "******"

values['tbxUserID'] = "XXXXXXX"

values['InputPwd'] = "XXXXXX"

values['btnLogin.x'] = "55"

values['btnLogin.y'] = "23"

postdata = urllib.urlencode(values)

#登录教务系统的URL

loginUrl = 'http://yjsgl.***.edu.cn/login.aspx'

#模拟登录，并把cookie保存到变量

#设置header

user_agent = 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/45.0.2454.101 Safari/537.36'

opener.addheaders.append( ('Host', 'yjsgl.fzu.edu.cn') )

opener.addheaders.append( ('User-Agent', user_agent) )

opener.addheaders.append( ('Accept', 'text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,*/*;q=0.8') )

opener.addheaders.append( ('Accept-Language', 'zh-CN,zh;q=0.8') )

opener.addheaders.append( ('Accept-Encoding', 'gzip, deflate') )

opener.addheaders.append( ('Connection', 'keep-alive') )

opener.addheaders.append( ('Referer', 'http://yjsgl.fzu.edu.cn/login.aspx') )

try:

    result = opener.open(loginUrl,postdata)

except opener.URLError, e:

    print e.reason

for item in cookie:

    print 'Name = '+item.name

    print 'Value = '+item.value

#保存cookie到cookie.txt中

cookie.save(ignore_discard=True, ignore_expires=True)

#利用cookie请求访问另一个网址，此网址是成绩查询网址

gradeUrl = 'http://yjsgl.***.edu.cn/xsgl/xsxx_show.aspx'

#请求访问成绩查询网址

result = opener.open(gradeUrl)

print result.read()

直接从本地读取cookie模拟登陆

# -*- coding: utf-8 -*-

"""

Created on Fri Apr 14 16:12:55 2017

@author: zeze

"""

import cookielib

import urllib2

#创建MozillaCookieJar实例对象

cookie = cookielib.MozillaCookieJar()

#从文件中读取cookie内容到变量

cookie.load('cookie.txt', ignore_discard=True, ignore_expires=True)

#创建请求的request

Url = urllib2.Request("http://yjsgl.***.edu.cn/xsgl/xsxx_show.aspx")

#利用urllib2的build_opener方法创建一个opener

opener = urllib2.build_opener(urllib2.HTTPCookieProcessor(cookie))

response = opener.open(Url)

print response.read()

　　Python3版本

import urllib

#import cookielib

import  http.cookiejar

filename = 'cookie.txt'

# 声明一个MozillaCookieJar对象实例来保存cookie，之后写入文件

#设置一个cookie处理器，它负责从服务器下载cookie到本地，并且在发送请求时带上本地的cookie

cookie = http.cookiejar.MozillaCookieJar(filename)

#opener = urllib2.build_opener(urllib2.HTTPCookieProcessor(cookie))

cookie_support = urllib.request.HTTPCookieProcessor(cookie)

opener = urllib.request.build_opener(cookie_support, urllib.request.HTTPHandler)

urllib.request.install_opener(opener)

# 设置请求参数

values = {}

values['__VIEWSTATE'] = "/wEPDwUJODA3MTI1345b2xzUmVxdWlyZVBvc3RCYWNrS2V5X18WAgUIYnRuTG9naW4FDEltYWdlQnV0dG9uMQ=="

values['tbxUserID'] = "1345"

values['InputPwd'] = "5345e"

values['btnLogin.x'] = "55"

values['btnLogin.y'] = "23"

#postdata = urllib.urlencode(values)

postdata=urllib.parse.urlencode(values).encode('utf-8') 

# 登录教务系统的URL

loginUrl = 'http://yjsgl.123.e34u.cn/login.aspx'

# 模拟登录，并把cookie保存到变量

# 设置header

user_agent = 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/45.0.2454.101 Safari/537.36'

opener.addheaders.append(('Host', 'yjsgl.fzu.edu.cn'))

opener.addheaders.append(('User-Agent', user_agent))

opener.addheaders.append(

    ('Accept', 'text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,*/*;q=0.8'))

opener.addheaders.append(('Accept-Language', 'zh-CN,zh;q=0.8'))

opener.addheaders.append(('Accept-Encoding', 'gzip, deflate'))

opener.addheaders.append(('Connection', 'keep-alive'))

opener.addheaders.append(('Referer', 'http://yjsgl.f234u.cn/login.aspx'))

try:

    result = opener.open(loginUrl, postdata)

except opener.URLError as e:

    print(e.reason)

for item in cookie:

    print('Name = ' + item.name)

    print('Value = ' + item.value)

# 保存cookie到cookie.txt中

cookie.save(ignore_discard=True, ignore_expires=True)

# 利用cookie请求访问另一个网址，此网址是成绩查询网址

gradeUrl = 'http://yjsgl.fzu.edu.cn/xsgl/xsxx_show.aspx'

# 请求访问成绩查询网址

result = opener.open(gradeUrl)

print("返回的结果")

print(result.read().decode('utf8'))#先看.info 解决乱码的问题

text = result.read()

save_path="D:/snatch2.txt"

# save_path 's file unnecessary to be exist

f_obj = open(save_path,'wb')

f_obj.write(text)

print("snatch successfully.")

【Python爬虫】教务处模拟登陆的更多相关文章

Python爬虫之模拟登录微信wechat
不知何时,微信已经成为我们不可缺少的一部分了,我们的社交圈.关注的新闻或是公众号.还有个人信息或是隐私都被绑定在了一起.既然它这么重要,如果我们可以利用爬虫模拟登录,是不是就意味着我们可以获取这些信息 ...
Python实现网站模拟登陆
一.实验简介 1.1 基本介绍本实验中我们将通过分析登陆流程并使用 Python 实现模拟登陆到一个实验提供的网站,在实验过程中将学习并实践 Python 的网络编程,Python 实现模拟登陆的方 ...
Python爬虫-百度模拟登录（二）
上一篇-Python爬虫-百度模拟登录(一) 接上一篇的继续参数 codestring codestring jxG9506c1811b44e2fd0220153643013f7e6b1898075 ...
Python爬虫-百度模拟登录（一）
千呼万唤屎出来呀,百度模拟登录终于要呈现在大家眼前了,最近比较忙,晚上又得早点休息,这篇文章写了好几天才完成.这个成功以后,我打算试试百度网盘的其他接口实现.看看能不能把服务器文件上传到网盘,好歹也有 ...
pytho简单爬虫_模拟登陆西电流量查询_实现一键查询自己的校园网流量
闲来无事,由于校园内网络是限流量的,查询流量很是频繁,于是萌生了写一个本地脚本进行一键查询自己的剩余流量. 整个部分可以分为三个过程进行: 对登陆时http协议进行分析利用python进行相关的模拟 ...
python作业：模拟登陆（第一周）
模拟登陆作业需求: 1. 用户输入帐号密码进行登陆 2. 用户信息保存在文件内 3. 用户密码输入错误三次后锁定用户额外实现功能: 1.提示输入错误次数 2.输入已锁定用户会提示 3.用户不存在会提 ...
python之scrapy模拟登陆人人网
1.settings.py主要配置信息,包括USER_AGENT等 # -*- coding: utf-8 -*- # Scrapy settings for renren project # # F ...
Python 爬虫之模拟登录
最近应朋友要求,帮忙爬取了小红书创作平台的数据,感觉整个过程很有意思,因此记录一下.在这之前自己没怎么爬过需要账户登录的网站数据,所以刚开始去看小红书的登录认证时一头雾水,等到一步步走下来,最终成功, ...
爬虫——cookie模拟登陆
cookie适用于抓取需要登录才能访问的页面网站 cookie和session机制 http协议为无连接协议,cookie: 存放在客户端浏览器,session: 存放在Web服务器人人网登录案例 ...

随机推荐

树莓派进阶之路 (010) - 树莓派raspi-config配置（转）
经过前面两步我们的树莓派已经正常的工作起来了,但是在真正用它开发之前还需要进行一些列的配置以及软件的安装,这样开发起来才会得心应手,下面我们介绍一下常用的软件和服务 1.配置选项: 树莓派第一次使用的 ...
【jsp】怎么在jsp文件中引入静态文件(.js .css)
如果在jsp文件中引入静态文件比如(.js或.css等等),可以在使用 /项目名称/路径的方式,但是这种方式如果在修改了项目了名称后就显得比较麻烦了.除了之外还许多方式,比如相对路径等等.一般情况下 ...
VS2017 IDE开发工具选型、安装和使用
原文地址:https://blog.csdn.net/boonya/article/details/78739500 距离上次使用VS工具已是2年前了,这次准备选择比较新的版本来开发桌面程序了.总的来 ...
java单双派机制理解
引言:Java是一个支持双分派的单分派语言知道java是支持后期动态绑定,也知道访问者模式,但是两者之间的关系,还真不知道,况且在这之间还有一个静态绑定. 1.动态绑定 class Father { ...
[企业化NET]Window Server 2008 R2[3]-SVN 服务端和客户端基本使用
1. 服务器基本安装即问题解决记录 √ 2. SVN环境搭建和客户端使用 2.1 服务端和客户端安装 √ 2.2 项目建立与基本使用 √ 2.3 基本冲突解决, ...
Linux下实现脚本监测特定进程占用内存情况
Linux系统下,我们可以利用以下命令来获取特定进程的运行情况: cat /proc/$PID/status 其中PID是具体的进程号,这个命令打印出/proc/特定进程/status文件的内容,信息 ...
ios标准开发者账号 ios企业开发者账号的区别总结
ios标准开发者账号 ios企业开发者账号的区别总结 ios标准开发者项目 1.ios标准开发者项目账号可以发布到app store 2.ios标准开发者项目分为两种:①个人开发者②公司/机构开发 ...
SharePoint自动化部署，利用PowerShell 导入用户至AD——PART II
这是对上一篇文章<SharePoint自动化部署,利用PowerShell 导出/导入AD中的用户>进行补充.开发时,为了测试和演示,我们往往需要经常性的把用户添加到AD中.数据量小的时候 ...
PHP中的$_SERVER超全局变量
详细参数 PHP编程中经常需要用到一些服务器的一些资料,特把$_SERVER的详细参数整理下,方便以后使用. $_SERVER['PHP_SELF'] #当前正在执行脚本的文件名,与 document ...
[转] Spring4.3.x 浅析xml配置的解析过程（6）——解析context命名空间之property-placeholder和property-override标签
在上一篇解析自定义命名空间的标签中,我们已经知道解析自定义命名空间的标签需要用到NamespaceHandler接口的实现类,并且知道spring是如何获取命名空间对应的命名空间处理器对象的.因此我们 ...

【Python爬虫】教务处模拟登陆

Python2模拟登陆获取cookie

直接从本地读取cookie模拟登陆

Python3版本

【Python爬虫】教务处模拟登陆的更多相关文章

随机推荐

热门专题

　　Python3版本