2014-12-23

  东方时尚约车还要网上选课,资源太紧张了,于是我决定自己写一个抢票程序来帮我刷票。

  第一步,抓包。浏览器登陆选课系统,用抓包工具观察网络行为,这里我用的fildder。这里抓包主要需要获取两个信息,一是浏览器发送了哪几条url请求,二是获得http报文的头部以及post出去的data内容和格式。

  第二步,模拟登陆。将抓取来的头部抄过来,让python模拟浏览器进行登陆,输入用户名和密码。这里登陆需要验证码,先来一个手工识别的,让python把获取到的.jpg文件保存到本地,然后暂停等待输入,人眼识别出验证码后输入给程序,让程序继续执行。一开始总是说验证码错误,最后发现时请求方式不对,这里要注意,每次获取url都要用同一个opener去获取,这样服务器才会认为是同一只浏览器。修改后,登录成功。

  第三步,解决验证码。手工输入验证码总非长远之计,还是要让机器去做。这里用了PIL包和pytesser包,里面有实现好了的解析验证码的方法,直接拿来用就行了。由于这个包对验证码的识别率不是100%,所以我把登录的代码放进一个while循环里,直到顺利登录为止。

  第四步,抢课。继续抓包,分析选课的ur请求过程,然后让程序模拟。比如在浏览器发现周五晚上有一节课可以选,然后让程序去抢周五晚上的课,程序返回结果显示ok,刷新浏览器,这节课确实选上了,说明程序大功告成了!

  后续,读数据。东方时尚网站的制作者也不是完全吃素的。由于好的时间段通常都选不到课,我让我的程序做while循环,一直刷课直到选上为止。刷了几小时后,网页说我的操作次数过多,今天禁止我的访问。为了解决这个问题,我把刷课的频率改为10分钟一次。由于选课也需要验证码,而验证码识别率不高,这样如果有课的时候因为验证码错误却要等待10分钟岂不是浪费机会了,所以我又将程序改为如果没课,就等待10分钟,如果有课就一直刷。这样就又需要提取数据,分析网页结构,发现有一个单独的url用来存储数据,剩余课时在其中的一个json格式的字符串里。先用正则匹配提取出这个串,然后解析这个json数据就得到需要的数据啦!

  最后,贴上我的代码:

 import re
import json
import time
import urllib
import urllib2
import urlparse
import cookielib
from PIL import Image, ImageDraw, ImageFont, ImageFilter
from pytesser import *
from datetime import date
import os os.chdir('C://Python27/Lib/site-packages/pytesser') def getVerify(name):
#data = urllib2.urlopen(
im = Image.open(name)
imgry = im.convert('L')
text = image_to_string(imgry)
text = re.sub('\W','',text)
return text def urlToString(url):
data = urllib2.urlopen(url).read()
f = open('buffer/temp.jpg', 'wb')
f.write(data)
f.close()
return getVerify('buffer/temp.jpg') def openerUrlToString(opener, url):
data = opener.open(url).read()
f = open('buffer/temp.jpg', 'wb')
f.write(data)
f.close()
return getVerify('buffer/temp.jpg') def getOpener(head):
# deal with the Cookies
cj = cookielib.CookieJar()
pro = urllib2.HTTPCookieProcessor(cj)
opener = urllib2.build_opener(pro)
header = []
for key, value in head.items():
elem = (key, value)
header.append(elem)
opener.addheaders = header
return opener def decodeAnyType(data):
ret = data
try:
temp = data.decode('utf-8')
ret = temp
except:
pass
try:
temp = data.decode('gbk')
ret = temp
except:
pass
try:
temp = data.decode('gb2312')
ret = temp
except:
pass
return ret header = {
'Connection': 'Keep-Alive',
'Accept': 'text/html, application/xhtml+xml, */*',
'Accept-Language': 'en-US,en;q=0.8,zh-Hans-CN;q=0.5,zh-Hans;q=0.3',
'User-Agent': 'Mozilla/5.0 (Windows NT 6.3; WOW64; Trident/7.0; rv:11.0) like Gecko',
'Accept-Encoding': 'gzip, deflate',
'Host': 'wsyc.dfss.com.cn',
'DNT': ''
} ## the data below are settled by customer to select the class needed
start =
end =
numid = ''
year =
month =
day =
username = 'myname'
password = 'mypasswd' opener = getOpener(header)
url1 = 'http://wsyc.dfss.com.cn/'
url2 = 'http://wsyc.dfss.com.cn/DfssAjax.aspx'
url3 = 'http://wsyc.dfss.com.cn/validpng.aspx?aa=3&page=lg'
url4 = 'http://wsyc.dfss.com.cn/pc-client/jbxx.aspx'
url5 = 'http://wsyc.dfss.com.cn/validpng.aspx' ## try to login until the validcode is right
count =
while True:
print '------------------------'
print 'have tryed to login %d times, now try again!' % (count)
count = count +
validcode = openerUrlToString(opener, url3)
print 'the validcode is ' + validcode
postDict = {
'AjaxMethod': 'LOGIN',
'Account': username,
'ValidCode': validcode,
'Pwd': password
} postData = urllib.urlencode(postDict).encode()
op = opener.open(url2, postData)
result = op.read().decode('utf-8')
print 'the result of login is ' + result
#if result.find('true') >= 0:
if result == 'true':
print 'login success!'
break
else:
continue yuechedate = date(year, month, day)
today = date.today()
intervaldays = (yuechedate - today).days
print intervaldays
if intervaldays < :
exit()
validcode = ''
count =
## try to select a class until success
while True:
print '--------------------------'
print 'have tryed to select %d times, now try again!' % (count)
count = count +
try:
validcode = openerUrlToString(opener, url5)
except:
continue
url7 = 'http://wsyc.dfss.com.cn/Ajax/StuHdl.ashx?loginType=2&method=stu'\
+ '&stuid=%s&sfznum=&carid=&ValidCode=%s' % (username, validcode)
data = opener.open(url7).read().decode('utf-8')
strs = re.search('\[\{\"fchrdate.*?\}\]', data)
#print data
print strs
if strs is None:
continue
jsontext = json.loads(strs.group())
num = jsontext[intervaldays][numid].split('/')[]
print 'remain num is ' + num
if num == '':
print 'no class avaliable!'
time.sleep()
continue
try:
validcode = openerUrlToString(opener, url5)
except:
continue
url6 = 'http://wsyc.dfss.com.cn/Ajax/StuHdl.ashx?loginType=2&method=yueche'\
+ '&stuid=%s&bmnum=BD14101500687&start=%d&end=%d' % (username, start, end)\
+ '&lessionid=001&trainpriceid=BD13040300001&lesstypeid=02'\
+ '&date=%d-%d-%d' % (year, month, day)\
+ '&id=1&carid=&ycmethod=03&cartypeid=01&trainsessionid=0' + numid\
+ '&ReleaseCarID=&ValidCode=' + validcode
result = opener.open(url6).read().decode('utf-8')
print 'result of select is ' + result
if result == 'success':
print 'select success!'
break
else:
continue

一个用python实现的东方时尚(驾校)抢课程序的更多相关文章

  1. psutil一个基于python的跨平台系统信息跟踪模块

    受益于这个模块的帮助,在这里我推荐一手. https://pythonhosted.org/psutil/#processes psutil是一个基于python的跨平台系统信息监视模块.在pytho ...

  2. 一个使用 Python 的人工智能聊天机器人框架

    一个Python 的 AI Chatbot框架 建立一个聊天室可以听起来很棒,但它是完全可行的. IKY是一个内置于Python中的AI动力对话对话界面. 使用IKY,很容易创建自然语言会话场景,无需 ...

  3. 部署一个基于python语言的web发布环境

    ---恢复内容开始--- 1) 一门面向对象的语言 2)拥有丰富的库 3)可移植性 4)免费.开源 5)简单易易学 可做软件开发.人工智能.web开发等等 部署流程: Cnetos7.5+Nginx+ ...

  4. 一个用python写的比特币均线指标

    https://blog.csdn.net/gsl222/article/details/104554397 https://github.com/yyy999/auto_ma912 一个用pytho ...

  5. 推荐一个学习python非常好的网站

    推荐一个入门python非常好的网站(也可以学习JAVA)非常适合入门,不说多易于理解,也是比较亲民的0基础学习教程,还免费…… 网址:https://www.liaoxuefeng.com/(廖雪峰 ...

  6. python函数的实例,书写一个创建有针对性的专用密码字典的程序

    python学习,实战学习,函数的学习与使用,综合知识的运用.包括for ,while循环,if...else.. 和if... elif ... else 的条件判断! 问题描述:书写一个创建有针对 ...

  7. python把汉字转换成拼音实现程序

    python把汉字转换成拼音实现程序 文章一个简洁干的汉字转拼音 程序,复制下载就可以直接使用,有需要的同学可以参考一下下. #coding:utf-8 #基于python2.6 table = 'a ...

  8. Python 项目实践三(Web应用程序)第一篇

    一 Djangao入门 当今的网站实际上都是富应用程序(rich application),就像成熟的桌面应用程序一样.Python提供了一组开发Web应用程序的卓越工具.在本章中,你将学习如何使用D ...

  9. 20180821 Python学习笔记:如何获取当前程序路径

    20180821 Python学习笔记:如何获取当前程序路径 启动的脚本的路径为:D:\WORK\gitbase\ShenzhenHouseInfoCrawler\main.py 当前脚本的路径为:D ...

随机推荐

  1. 80 多个 Linux 系统管理员的监控工具

    原文出处: serverdensity   译文出处:Linux中国 随着互联网行业的不断发展,各种监控工具多得不可胜数.这里列出网上最全的监控工具.让你可以拥有超过80种方式来管理你的机器.在本文中 ...

  2. @property中有哪些属性关键字?/ @property 后面可以有哪些修饰符?

    出题者简介: 孙源(sunnyxx),目前就职于百度 整理者简介:陈奕龙(子循),目前就职于滴滴出行. 转载者:豆电雨(starain)微信:doudianyu 属性可以拥有的特质分为四类: 原子性- ...

  3. Hadoop HDFS (3) JAVA訪问HDFS

    如今我们来深入了解一下Hadoop的FileSystem类. 这个类是用来跟Hadoop的文件系统进行交互的.尽管我们这里主要是针对HDFS.可是我们还是应该让我们的代码仅仅使用抽象类FileSyst ...

  4. Junit使用教程(一)

    几乎所有程序员都听说过Junit的大名,但不知真正懂得运用它的人有多少,我便是其中的一个小白. 知道Junit是用来测试的,但却把“宝刀”当成了“菜刀”用.为了从此不再菜鸟,特此总结整理了下Junit ...

  5. [Android] Service和IntentService中显示Toast的区别

    1. 表象     Service中可以正常显示Toast,IntentService中不能正常显示Toast,在2.3系统上,不显示toast,在4.3系统上,toast显示,但是不会消失. 2. ...

  6. css中var函数

    引言: 在学习elementui的时候看到一个var.css, 其中写的全部都是以--开头的属性,上google查询不是css3新增的属性,于是决定一探究竟 :root { /* Transition ...

  7. HDU 4455(dp)

    题意:给定一个序列ai,个数为n.再给出一系列w:对于每个w,求序列中,所有长度为w的连续子串中的权值和,子串权值为子串中不同数的个数. 思路:动态规划,用dp[w]表示当前长度为w的时候的权值和.显 ...

  8. Python之路,Day10 - 异步IO\数据库\队列\缓存

    Python之路,Day9 - 异步IO\数据库\队列\缓存   本节内容 Gevent协程 Select\Poll\Epoll异步IO与事件驱动 Python连接Mysql数据库操作 RabbitM ...

  9. 【Python之旅】第六篇(七):开发简易主机批量管理工具

    [Python之旅]第六篇(七):开发简易主机批量管理工具 python 软件开发 Paramiko模块 批量主机管理 摘要: 通过前面对Paramiko模块的学习与使用,以及Python中多线程与多 ...

  10. android EditText设置光标、边框和图标

    控制边框形状,先在drawable中建一个xml文件:shape.xml <?xml version="1.0" encoding="utf-8"?> ...