Python实现查询12306火车票信息

例子来源于马哥的公众号，看了几遍，有些地方存在些疑问，然后就自己查找些资料，重写的一下，但是对于获取到的信息，并不能有效的解析出来，而且对于中文字符处理，并不是很好，请大神指教下！谢过！

　　1、接口设置：用户只要输入出发站，到达站及日期就能查到火车信息；python tickets [-hgdtkz] from to date

　　2、解析参数，使用docopt模块

　　3、获取数据，打开12306官网余票查询的界面，浏览器按F2到开发人员工具界面，点击network标签，再点击查询，有查询URL，这个将是我们要使用的URL，但是发现from_station 和to_station并不是汉字，是一个代号；

　　4、获取各个站点的代号，打开网面的源代码可以查询到汉字与代号的转换的URL：https://kyfw.12306.cn/otn/resources/js/framework/station_name.js?station_version=1.9010

　　5、将用户的请求转换为站点代号再请求数据；

第一步：

先获取站点的代号（调用函数时将转换URL代入参数即可）：

def Main(IP):
Re = urllib2.Request(IP)
try:
Response = urllib2.urlopen(Re,timeout=5)
with open ('./urllib2_content.txt','w+') as fp:
fp.write(Response.read())
print "目标地址为:%s"%Response.geturl()
print "目标返回代码为:%s"%Response.getcode()
print "目标信息为:%s"%Response.info()
print "已获取目标主机内容,存放当前目录下的urllib2_content.txt,请自行查看！！！"

第二步：解析站点代码（此部分没有很好解决中文字符的匹配）

#!/usr/bin/env python
#coding:utf-8
import re
with open('urllib2_content.txt') as fp:
text = fp.read()
stations = re.findall(u"([\x80-\xff]+)\|([A-Z]+)",text)
for i in stations:
print "\""+i[0]+"\""+" : "+"\""+i[1]+"\""+","

第三步：将解析后的代码制作成字典（部分内容）

#!/usr/bin/env python
#coding:utf-8
stations = {"北京北" : "VAP",
"北京东" : "BOP",
"北京" : "BJP",
"北京南" : "VNP",
"北京西" : "BXP"......}

第四步：请求转换

#!/usr/bin/env python

#coding:utf-8

"""Train tickets query via command-line.

Usage:

    tickets [-gdtkz] <from> <to> <date>

Options:

    -h,--help       帮助

    -g              高铁

    -d              动车

    -t              特快

    -k              快车

    -z              直达

Example:

    tickets 南京 北京 2016-07-01

    tickets -dg 南京 北京 2016-07-01

"""

import docopt,json,requestsfrom station import stations

def cli():

    """command-line interface"""

    arguments = docopt.docopt(__doc__)

    from_station = stations.get(arguments['<from>'])

    to_station = stations.get(arguments['<to>'])

    date = arguments['<date>']

    url = "https://kyfw.12306.cn/otn/leftTicket/query?leftTicketDTO.train_date=%s&leftTicketDTO.from_station=%s&leftTicketDTO.to_station=%s&purpose_codes=ADULT"%(date,from_station,to_station)

    j = 0

    r = requests.get(url,verify=False)

    for i in r.json()["data"]["result"]:

        print i

        j += 1

        print j

if __name__ == "__main__":

    cli()

Python实现查询12306火车票信息的更多相关文章

python django查询12306火车票
逢年过节,想坐个高铁票,都得上12306去买票,但用过的都会发现,它会把临近站点的也筛出来了.但有时我们压根就不会考虑买到临近站点的. 另一方面,在购票高峰期,有可能你要的出发站到目的站都没有票了,这 ...
Python 爬取12306火车票
获取火车站 stations.py #import certifi #import urllib3 import re import requests from pprint import pprin ...
python爬虫之12306网站--火车票信息查询
python爬虫之12306网站--火车票信息查询思路: 1.火车票信息查询是基于车站信息查询,先完成车站信息查询,然后根据车站信息查询生成的url地址去查询当前已知出发站和目的站的所有车次车票信息 ...
python爬虫之12306网站--车站信息查询
python爬虫查询车站信息目录: 1.找到要查询的url 2.对信息进行分析 3.对信息进行处理 python爬虫查询全拼相同的车站目录: 1.找到要查询的url 2.对信息进行分析 3.对信息 ...
使用python制作查询火车票工具
使用python脚本实现查询火车票信息的效果图如下: 实现的代码: # coding: utf-8 """命令行火车票查看器 Usage: tickets [-gdtkz ...
Python 实现的 12306抢票脚本
Python12306抢票脚本本脚本使用一个类来实现所有代码,大体上分为以下几个模块及其步骤:- 初始化对象属性(在抢票前进行的属性初始化,包括初始化浏览器模拟对象,个人信息等).- 建立模拟浏览器 ...
python+splinter实现12306网站刷票并自动购票流程
python+splinter实现12306网站刷票并自动购票流程通过python+splinter,实现在12306网站刷票并自动购票流程(无法自动识别验证码). 此类程序只是提高了12306网站 ...
在linux中查询硬件相关信息
1.查询cpu的相关 a.查询CPU的统计信息使用命令:lscpu 得到的结果如下: Architecture: x86_64 CPU op-mode(s): -bit, -bit Byte Ord ...
查询rman备份信息经常使用指令
查询rman备份信息经常使用指令 ----登陆到rman $rman target / ----以精简的格式查看备份信息 RMAN> list backup of database summar ...

随机推荐

JAVA将Object数组转换为String数组
java.lang.ClassCastException: [Ljava.lang.Object; cannot be cast to [Ljava.lang.String; java将Object[ ...
Windows系统安装ActiveMQ
1.下载安装包:https://activemq.apache.org/components/classic/download/ 选择自己的版本进行下载 2.安装JDK 3.把下载的ActiveMQ压 ...
Spring Boot去掉浏览器默认的叶子图标
在Spring Boot的配置文件application.properites中添加配置项,可以关闭默认的Favicon spring.mvc.favicon.enabled=false
UiPath RPA培训2021.4版本解读 (2021年5月)-RPA学习天地
2021年5月26日Ui Path发布了新产品2021.4版本,我们来看看有什么新功能: 说明一下uipath的版本发布节奏: uipath的版本一般是每年发布2个版本,其中5月份发布的一般是FTS版 ...
论文解读SDCN《Structural Deep Clustering Network》
前言主体思想:深度聚类需要考虑数据内在信息以及结构信息. 考虑自身信息采用基础的 Autoencoder ,考虑结构信息采用 GCN. 1.介绍在现实中,将结构信息集成到深度聚类中通常需要解决以 ...
sigslot之简化版
1.关于 1.1 基于原版sigslot做了部分修改.原版的信号支持最多支持8个参数,改进后,最多支持1个参数,这样肯定不能满足日常需求,但是,我们可以将信号的一个参数改为类型指针,比如信号定义时的模 ...
【LeetCode】822. Card Flipping Game 解题报告（Python）
作者: 负雪明烛 id: fuxuemingzhu 个人博客: http://fuxuemingzhu.cn/ 题目地址:https://leetcode.com/problems/card-flip ...
【LeetCode】846. Hand of Straights 解题报告（Python & C+）
作者: 负雪明烛 id: fuxuemingzhu 个人博客: http://fuxuemingzhu.cn/ 目录题目描述题目大意解题方法日期题目地址:https://leetcode.c ...
Generative Adversarial Nets (GAN)
目录目标框架理论数值实验代码 Generative Adversarial Nets 这篇文章,引领了对抗学习的思想,更加可贵的是其中的理论证明,证明很少却直击要害. 目标 GAN,译名生成 ...
使用 JavaScript 中的变量、数据类型和运算符，计算出两个 number 类型的变量与一个 string 类型的变量的和，根据 string 类型处于运算符的不同位置得到不同的结果
查看本章节查看作业目录需求说明: 使用 JavaScript 中的变量.数据类型和运算符,计算出两个 number 类型的变量与一个 string 类型的变量的和,根据 string 类型处于运算 ...

Python实现查询12306火车票信息

Python实现查询12306火车票信息的更多相关文章

随机推荐

热门专题