python爬虫之登录

#-*-coding:utf--*-

import cookielib, urllib, urllib2

import json

import threading,time

class Order(object):

########## login

    def __init__(self):

        print "init"

    def speak(self):

        count =

        url = "http://zweb.com/login"

        data='{"email":"a@test.com", "password":"***"}'

        # jdata = json.dumps(data)

        # post_data=urllib.urlencode(jdata)

        headers ={'User-Agent':'Mozilla/5.0 (compatible; MSIE 9.0; Windows NT 8.1)','Acc

ept-Encoding': 'gzip, deflate','Connection':'keep-alive'}

        ckjar = cookielib.MozillaCookieJar('./cookie.txt2')

        opener = urllib2.build_opener(urllib2.HTTPCookieProcessor(ckjar))

        req=urllib2.Request(url,data,headers)

        req.add_header('Content-Type', 'application/json')

        result = opener.open(req)

        htm = result.read()

        print htm

        ckjar.save(ignore_discard=True, ignore_expires=True)

        url = "http://zhweb.kingsoft.com/foodBookingOrders"

        data = {"foodBookingPlanId":,"items":[{"planItemId":},{"planItemId":},{"

planItemId":308}]}

        jdata = json.dumps(data)

        headers ={'User-Agent':'Mozilla/5.0 (compatible; MSIE 9.0; Windows NT 8.1)','Acc

ept-Encoding': 'gzip, deflate','Connection':'keep-alive'}

        while count >= :

            req=urllib2.Request(url,jdata)

            # req.add_header('Content-Type', 'text/plain;charset=UTF-8')

            req.add_header('Content-Type', 'application/json')

            result = opener.open(req)

            htm = result.read()

            print htm

            file_object = open('./out.txt', 'a')

            file_object.write(htm)

            file_object.close( )

            time.sleep()

            count=count - 

##########

if __name__ == "__main__":

    p = Order()

    p.speak()

    #count =

    #while count > :

    #    timer = threading.Timer(, p.speak(), (p,))

    #    print "start"

    #    timer.start()

    #    timer.join()

    #    print "after join"

    #    count=count -

    #    timer.cancel()

python爬虫之登录的更多相关文章

python爬虫模拟登录验证码解决方案
[前言]几天研究验证码解决方案有三种吧.第一.手工输入,即保存图片后然后我们手工输入:第二.使用cookie,必须输入密码一次,获取cookie:第三.图像处理+深度学习方案,研究生也做相关课题,就用 ...
python爬虫模拟登录的图片验证码处理和会话维持
目标网站:古诗文网登录界面显示: 打开控制台工具,输入账号密码,在ALL栏目中进行抓包数据如下: 登录请求的url和请求方式登录所需参数参数分析: __VIEWSTATE和__VIEWSTAT ...
Python爬虫模拟登录带验证码网站
问题分析: 1.爬取网站时经常会遇到需要登录的问题,这是就需要用到模拟登录的相关方法.python提供了强大的url库,想做到这个并不难.这里以登录学校教务系统为例,做一个简单的例子. 2.首先得明白 ...
python爬虫——跟踪登录过程以及意外的发现（4）
新浪微博的消息还是很多的,值得弄个账号去爬.不过都有账号了,还需要特意再搞一个吗? 直接上去跟踪.分别使用www和wap端登录: wap端相对简单,form表单都没有用到前面传的数据.但是我看到表单时 ...
Python爬虫目录
Python爬虫目录工具使用 Pycharm 连接Linux 远程开发 mongodb在windows下安装启动爬虫抓包工具Fiddle设置爬虫抓包工具Charles设置爬虫工具fiddle在 ...
python爬虫中图形验证码的处理
使用python爬虫自动登录时,遇到需要输入图形验证码的情况,一个比较简单的处理方法是使用打码平台识别验证码. 使用过两个打码平台,打码兔和若快,若快的价格更便宜,识别率相当.若快需要注册两个帐号:开 ...
[Python爬虫] Selenium实现自动登录163邮箱和Locating Elements介绍
前三篇文章介绍了安装过程和通过Selenium实现访问Firefox浏览器并自动搜索"Eastmount"关键字及截图的功能.而这篇文章主要简单介绍如何实现自动登录163邮箱,同时 ...
python爬虫scrapy框架——人工识别登录知乎倒立文字验证码和数字英文验证码(2)
操作环境:python3 在上一文中python爬虫scrapy框架--人工识别知乎登录知乎倒立文字验证码和数字英文验证码(1)我们已经介绍了用Requests库来登录知乎,本文如果看不懂可以先看之前 ...
Python爬虫之模拟登录微信wechat
不知何时,微信已经成为我们不可缺少的一部分了,我们的社交圈.关注的新闻或是公众号.还有个人信息或是隐私都被绑定在了一起.既然它这么重要,如果我们可以利用爬虫模拟登录,是不是就意味着我们可以获取这些信息 ...

随机推荐

ASP.NET AJAX入门系列（11）：在多个UpdatePanle中使用Timer控件
本文将使用Timer控件更新两个UpdatePanel控件,Timer控件将放在UpdatePanel控件的外面,并将它配置为UpdatePanel的触发器,翻译自官方文档. 主要内容在多个Upda ...
在Hanlp词典手动添加未登录词的方式介绍
在使用Hanlp词典进行分词的时候,会出现分词不准的情况,原因是内置词典中并没有收录当前这个词,也就是我们所说的未登录词,只要把这个词加入到内置词典中就可以解决类似问题,如何操作呢,下面我们来看一下: ...
C++用 _findfirst 和 _findnext 查找文件
一.这两个函数均在io.h里面. 二.首先了解一下一个文件结构体: struct _finddata_t { unsigned attrib; time_t tim ...
[转] LINUX内核代码编程规范
这是一个简短的文档,描述了linux内核的首选代码风格.代码风格是因人而异的,而且我不愿意把我的观点强加给任何人,不过这里所讲述的是我必须要维护的代码所遵守的风格, 并且我也希望绝大多数其他代码也能 ...
使用php生成数字、字母组合验证码
项目中经常会遇到一些登陆验证,支付验证等等一系列安全验证的策略.实现方法多种多样,下面就来讲解下如何用php生成简单的文字+数字组合的验证码: 所用语言php,gd库原理解释: a>实质上是在 ...
进程池pool
如果有多个进程,同一时间只能有限个给cpu运行 from multiprocessing import Process,Pool import time,os def bar(arg): print( ...
git 仓库相关命令
git配置文件 : .git/config 配置存储远程连接用户信息 [credential] helper = store 配置www用户下默认git pull账号和密码,这样每一个新加的项目都不用 ...
JS 动态加载脚本的4种方法
有时候我们需要动态的加入适合的js,因为有时候不需要将所有的js都加载进来,以来提高效率,但这种方法比较适合单个js文件比较大的情况如果js文件都比较小,还是一个js好,这样可以减少连接数.下面是4 ...
intellij idea 设置 Error 提示颜色修改
File--->Settings --->Editor --->ColorScheme--->General --->Errors and Warning--->E ...
NET Core Kestrel部署HTTPS
NET Core Kestrel部署HTTPS ASP.NET Core配置 Kestrel部署HTTPS.现在大部分网站已经部署HTTPS,大家对于安全越来越重视. 今天简单介绍一下ASP.NET ...

python爬虫之登录

python爬虫之登录的更多相关文章

随机推荐

热门专题