python模拟自动登录网站（urllib2）

不登录打开网页：

import urllib2

request = urllib2.Request('http://www.baidu.com')

response = urllib2.urlopen(request).read()

print response

保存网页图片（https://www.baidu.com/img/bd_logo1.png）：

picurl = 'https://www.baidu.com/img/bd_logo1.png' #定义图片的url地址

req = urllib2.Request(picurl)

data = urllib2.urlopen(req).read()

file=open('d:\\zaa.jpg','wb') #将图片保存为名为zaa.jpg的图片

file.write(data)

file.flush()

file.close()

模拟自动登录zabbix：

import urllib2,cookielib,urllib

#定义登录地址

login_url = 'http://10.16.2.4/zabbix/index.php'

#定义登录所需要用的信息，如用户名、密码等，详见下图，使用urllib进行编码

login_data = urllib.urlencode({

                        "name": 'admin',

                        "password": 'password',

                        "autologin": 1,

                        "enter": "Sign in"})

#设置一个cookie处理器，它负责从服务器下载cookie到本地，并且在发送请求时带上本地的cookie

cj = cookielib.CookieJar() #获取Cookiejar对象（存在本机的cookie消息）

opener = urllib2.build_opener(urllib2.HTTPCookieProcessor(cj)) #自定义opener,并将opener跟CookieJar对象绑定

urllib2.install_opener(opener) #安装opener,此后调用urlopen()时都会使用安装过的opener对象

response=opener.open(login_url,login_data).read() #访问登录页，自动带着cookie信息

print response #返回登陆后的页面源代码

zabbix登录页面内容：

有的页面登录时会post到其他页面，查看登录页面的form中的action地址，可能需要构造header头信息：

#发送头信息

headers = {

   'Referer':'http://10.16.2.4/zabbix/index.php',

   'Host':'10.16.2.4', #可以不要，一般两项就可以

   'User-Agent':'Mozilla/5.0 (Windows NT 10.0; WOW64; Trident/7.0; rv:11.0) like Gecko'

}

#定义登录地址

login_url = 'http://10.16.2.4/zabbix/index.php'

#定义登录所需要用的信息，如用户名、密码等，使用urllib进行编码

login_data = urllib.urlencode({

                        "name": 'admin',

                        "password": 'password',

                        "autologin": 1,

                        "enter": "Sign in"})

#设置一个cookie处理器，它负责从服务器下载cookie到本地，并且在发送请求时带上本地的cookie

cj = cookielib.CookieJar() #获取Cookiejar对象（存在本机的cookie消息）

opener = urllib2.build_opener(urllib2.HTTPCookieProcessor(cj)) #自定义opener,并将opener跟CookieJar对象绑定

urllib2.install_opener(opener) #安装opener,此后调用urlopen()时都会使用安装过的opener对象


urllib2.urlopen(login_url)#打开登录主页面（他的目的是从页面下载cookie，这样我们在再送post数据时就有cookie了，否则发送不成功） 


#通过urllib2提供的request方法来向指定Url发送我们构造的数据，并完成登录过程

req=urllib2.Request(post_url,login_data,headers) #post_url需要在请求过程中自己得出

response=urllib2.urlopen(req)
print response.read()
response.close()

在ie中手动登录后，可以看到相应的header头信息，如下：

模拟登录piao.x.com（先使用chrome抓包，输入一个错误的账号密码）：

import urllib,urllib2,cookielib

username='name'

password='pass'

loginurl='http://piao.x.com/loginHandler.ashx' #此为在登录过程中post到的页面

cj = cookielib.CookieJar()

opener=urllib2.build_opener(urllib2.HTTPCookieProcessor(cj))

headers={

        'User-Agent':'Mozilla/5.0 (Windows NT 6.3; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Maxthon/4.4.8.1000 Chrome/30.0.1599.101 Safari/537.36',

        'Referer':'http://piao.x.com/login/login',

        'Content-Type':'text/html'

        }

for key in headers: #增加多个header

    opener.addheaders.append((key,headers[key]))

data = urllib.urlencode({"username":username,"password":password}) #使用google可以看到此处的用户密码为明文发送，格式为username=username&password=password，如下图所示。

opener.open(loginurl,data)

print opener.open('http://piao.x.com/#dGlja2V0').read() #登录成功后可以打开其他页面。

Form Data部分为需要Post到Server的参数，piao登录需要Post的参数是2个，zabbix登录需要Post的参数是4个。

piao login:

zabbix login:

如上图所示，查看Respons Headers部分，可以看到其中的Set-Cookie，该cookie可以在后面的站内访问使用，使用urllib2也可以看到该部分内容：

import cookielib,urllib,urllib2

zabbix_url="http://10.16.2.4/zabbix/index.php"

zabbix_header = {"Content-Type":"application/json"}

zabbix_user   = "admin"

zabbix_pass   = "password"

cj = cookielib.CookieJar()

opener=urllib2.build_opener(urllib2.HTTPCookieProcessor(cj))

data = urllib.urlencode({"name":zabbix_user,"password":zabbix_pass,'form_refresh':1,'enter':'Sign in'})

response = opener.open(zabbix_url,data)

print response.headers #打印Server 的response header头部分内容：

返回：

Date: Wed, 25 May 2016 08:07:17 GMT

Server: Apache/2.4.6 (CentOS) PHP/5.4.16

X-Powered-By: PHP/5.4.16

Set-Cookie: zbx_sessionid=bbc97766e8c132a56f2d016a6963219a

Set-Cookie: PHPSESSID=v8sno86fnc19iqgltipae0l2d2; path=/zabbix/

Expires: Thu, 19 Nov 1981 08:52:00 GMT

Cache-Control: no-store, no-cache, must-revalidate, post-check=0, pre-check=0

Pragma: no-cache

Set-Cookie: PHPSESSID=v8sno86fnc19iqgltipae0l2d2; path=/zabbix/

Set-Cookie: PHPSESSID=v8sno86fnc19iqgltipae0l2d2; path=/zabbix/

Set-Cookie: PHPSESSID=v8sno86fnc19iqgltipae0l2d2; path=/zabbix/

Connection: close

Transfer-Encoding: chunked

Content-Type: text/html; charset=UTF-8

在urllib2中不再使用用户名密码，直接使用上面得到的cookie访问站内页面：

import cookielib,urllib,urllib2

zabbix_url="http://10.16.2.4/zabbix/index.php"

zabbix_header = {"Content-Type":"application/json"}

cj = cookielib.CookieJar()

opener=urllib2.build_opener(urllib2.HTTPCookieProcessor(cj))

zabbix_header = {'cookie':'zbx_sessionid=bbc97766e8c132a56f2d016a6963219a'} #使用前面得到的cookie

for key in zabbix_header: #增加多个header，把cookie放到header中，访问server时使用该cookie

    opener.addheaders.append((key,zabbix_header[key]))

print opener.open('http://10.16.2.4/zabbix/tr_status.php?fullscreen=0&groupid=0&hostid=0&show_triggers=1&ack_status=1&show_events=1&show_severity=0&txt_select=&application=&inventory%5B0%5D%5Bfield%5D=type&inventory%5B0%5D%5Bvalue%5D=&filter_set=Filter').read() #该页面可以直接访问，不再需要使用用户名密码等信息。

参考：http://www.cnblogs.com/sysu-blackbear/p/3629770.html 保存cookie到本地文件

　　 http://www.2cto.com/kf/201401/275152.html 详细，带有http具体访问过程

　　 http://www.jb51.net/article/63759.htm 简明

　　 http://www.blogjava.net/hongqiang/archive/2012/08/01/384552.html

python模拟自动登录网站（urllib2）的更多相关文章

java浏览器控件jxbrowser(简单demo模拟自动登录与点击)
写在前面: 老大让我写个脚本自动给他写dms有一段时间了,说实话当时不知道老大指的这个脚本是什么?毕竟是做web的,难道是写个数据库sql语句脚本吗?也就放在了一边.巧了,最近一个朋友说他之前写了个程 ...
利用Python模拟GitHub登录
最近学习了Fiddler抓包工具的简单使用,通过抓包,我们可以抓取到HTTP请求,并对其进行分析.现在我准备尝试着结合Python来模拟GitHub登录. Fiddler抓包分析首先,我们想要模拟一 ...
QQ模拟自动登录实现
QQ模拟自动登录实现本篇文章主要介绍"QQ模拟自动登录实现(带验证码)",主要涉及到java 实现QQ自动登录(带验证码)方面的内容,对于java 实现QQ自动登录(带验证码)感 ...
Java 扫描微信公众号二维码，关注并自动登录网站
https://blog.csdn.net/qq_42851002/article/details/81327770 场景:用户扫描微信公众号的二维码,关注后自动登录网站,若已关注则直接登录. 逻辑: ...
吴裕雄--天生自然PYTHON学习笔记：python自动登录网站
打开 www. 5 l eta . com 网站,如果己经通过某用户名进行了登录,那么先退出登录 . 登录该网站的步骤一般如下 : ( 1 )单击右上角的“登录”按钮. ( 2 )先输入账号. ( ...
python网络爬虫之使用scrapy自动登录网站
前面曾经介绍过requests实现自动登录的方法.这里介绍下使用scrapy如何实现自动登录.还是以csdn网站为例. Scrapy使用FormRequest来登录并递交数据给服务器.只是带有额外的f ...
定向爬虫 - Python模拟新浪微博登录
当我们试图从新浪微博抓取数据时,我们会发现网页上提示未登录,无法查看其他用户的信息. 模拟登录是定向爬虫制作中一个必须克服的问题,只有这样才能爬取到更多的内容. 实现微博登录的方法有很多,一般我们在模 ...
Python模拟校园网登录
最近忙着实验室的项目,学习的时间相对较少.前一段时间刚开始接触python时,依葫芦画瓢照着写了一个爬虫,爬取了某个网站的图片.当看到一张张图片自动出现在电脑屏幕上时,有些小小成就感.我想大多数人开始 ...
python 模拟豆瓣登录（豆瓣6.0）
最近在学习python爬虫,看到网上有很多关于模拟豆瓣登录的例子,随意找了一个试了下,发现不能运行,对比了一下代码和豆瓣网站,发现原来是豆瓣网站做了修改,增加了反爬措施. 首先看下要模拟登录的网站: ...

随机推荐

Jmeter报错之jmeter.gui.action.ActionRouter: Error processing gui.action.Start@1b7c473a java.lang.ArrayIndexOutOfBoundsException
一个使用了很久的Jmeter脚本,运行时Jmeter的UI界面上点击绿色按钮后,完全无反应,只有log报错,如下: 2017/06/28 14:29:23 ERROR - jmeter.gui.act ...
java监听器、定时器的使用
1.监听器在web.xml配置  <listener> <listener-class> com.hk.common.timer.Tim ...
mongodb备份策略
概述数据库的备份非常非常非常重要!!!否则出问题连哭的机会有没有(欲哭无泪)今天主要是做一个mongodb的数据库备份. 1.关于备份备份其实很简单,这里选择的是对mongodb中的某个库进行全备 ...
Could not load file or assembly ‘ Oracle.ManagedDataAccess.EntityFramework, Version=6.121.2.0, Culture=neutral, PublicKeyToken=89b483f429c47342’ or one of its dependencies系统找不到指定文件处理方法
前些天做EF Model-First测试,开发环境为VS2013,数据库为Oracle 11g.所有东西都装好数据模型已经建立后准备执行“根据模型生成数据库”命令时,出现:Could not load ...
MFC获取系统信息
一.获取系统时间 CString str,str2; CTime time; time = CTime::GetCurrentTime(); str = time.Format("%Y年%m ...
常用的7个SQl优化技巧
作为程序员经常和数据库打交道的时候还是非常频繁的,掌握住一些Sql的优化技巧还是非常有必要的.下面列出一些常用的SQl优化技巧,感兴趣的朋友可以了解一下. 1.注意通配符中Like的使用以下写法会造 ...
Codeforces550C(SummerTrainingDay01-H)
C. Divisibility by Eight time limit per test : 2 seconds memory limit per test : 256 megabytes input ...
LeetCode DB： Duplicate Emails
Write a SQL query to find all duplicate emails in a table named Person. +----+---------+ | Id | Emai ...
Ubuntu14.16.18更新源
一.源概述源,可以认为是软件库,使用apt-get install安装的时候,会在源保存的库中进行搜索,因此源(默认源在欧洲)会影响下载速度和资源数量二.更新源 1.步骤编辑/etc/apt/s ...
linux下将本地文件上传到github中？
今天编写一份Python基础代码,经过Linux上传到github上,遇到点问题,已经解决 1.首先sudo su 进入root 用户 2.ls 检查出当前文件下有什么文件 3. cd 进入你将要上传 ...

python模拟自动登录网站（urllib2）

python模拟自动登录网站（urllib2）的更多相关文章

随机推荐

热门专题