python抓取每期双色球中奖号码,用于分析
获取每期双色球中奖号码,便于观察,话不多说,代码如下
# -*- coding:utf-8 -*-
# __author__ :kusy
# __content__:获取每期双色球中奖号码
# __date__:2018/10/12 17:08
import urllib.request
import re class GetApiTxtByRegexp(object):
def __init__(self, url, regexp):
self.url = url
self.regexp = regexp def get_content(self):
page = urllib.request.urlopen(self.url)
content = page.read()
# print(content)
content_reg = re.compile(self.regexp)
list_content = re.findall(content_reg, content.decode('gbk'))
return list_content if __name__ == '__main__':
# 获取每期期号地址(暂时无法直接获取)
# url = 'http://kaijiang.500.com/shtml/ssq/18119.shtml?0_ala_baidu'
# regexp = r'' # url = 'http://kaijiang.500.com/shtml/ssq/18118.shtml'
regexp = r'<li class="ball_.*?">(\d*)</li>'
list_blue = []
for tikitno in range(18000, 18120, 1):
tikitno = str(tikitno)
url = 'http://kaijiang.500.com/shtml/ssq/' + tikitno + '.shtml'
try:
gettxt = GetApiTxtByRegexp(url, regexp)
list_content = gettxt.get_content()
list_blue.append(list_content[-1])
print(tikitno,'--',list_content)
except urllib.error.HTTPError:
pass # 获取各数字篮球出现的次数
list_cnt = [0] * 16
for blue in list_blue:
for i in range(1,17,1):
if int(blue) == i:
list_cnt[i-1] += 1
print(list_blue)
print(list_cnt)
d = dict(zip(list(range(1, 17, 1)), list_cnt))
d = sorted(d.items(), key=lambda x: x[1], reverse=True)
# 篮球出现次数排序
print(d)
结果如下图
E:\kusy\future\venv\Scripts\python.exe E:/kusy/future/double_color_ball.py
18001 -- ['', '', '', '', '', '', '']
18002 -- ['', '', '', '', '', '', '']
18003 -- ['', '', '', '', '', '', '']
18004 -- ['', '', '', '', '', '', '']
18005 -- ['', '', '', '', '', '', '']
18006 -- ['', '', '', '', '', '', '']
18007 -- ['', '', '', '', '', '', '']
18008 -- ['', '', '', '', '', '', '']
18009 -- ['', '', '', '', '', '', '']
18010 -- ['', '', '', '', '', '', '']
18011 -- ['', '', '', '', '', '', '']
18012 -- ['', '', '', '', '', '', '']
18013 -- ['', '', '', '', '', '', '']
18014 -- ['', '', '', '', '', '', '']
18015 -- ['', '', '', '', '', '', '']
18016 -- ['', '', '', '', '', '', '']
18017 -- ['', '', '', '', '', '', '']
18018 -- ['', '', '', '', '', '', '']
18019 -- ['', '', '', '', '', '', '']
18020 -- ['', '', '', '', '', '', '']
18021 -- ['', '', '', '', '', '', '']
18022 -- ['', '', '', '', '', '', '']
18023 -- ['', '', '', '', '', '', '']
18024 -- ['', '', '', '', '', '', '']
18025 -- ['', '', '', '', '', '', '']
18026 -- ['', '', '', '', '', '', '']
18027 -- ['', '', '', '', '', '', '']
18028 -- ['', '', '', '', '', '', '']
18029 -- ['', '', '', '', '', '', '']
18030 -- ['', '', '', '', '', '', '']
18031 -- ['', '', '', '', '', '', '']
18032 -- ['', '', '', '', '', '', '']
18033 -- ['', '', '', '', '', '', '']
18034 -- ['', '', '', '', '', '', '']
18035 -- ['', '', '', '', '', '', '']
18036 -- ['', '', '', '', '', '', '']
18037 -- ['', '', '', '', '', '', '']
18038 -- ['', '', '', '', '', '', '']
18039 -- ['', '', '', '', '', '', '']
18040 -- ['', '', '', '', '', '', '']
18041 -- ['', '', '', '', '', '', '']
18042 -- ['', '', '', '', '', '', '']
18043 -- ['', '', '', '', '', '', '']
18044 -- ['', '', '', '', '', '', '']
18045 -- ['', '', '', '', '', '', '']
18046 -- ['', '', '', '', '', '', '']
18047 -- ['', '', '', '', '', '', '']
18048 -- ['', '', '', '', '', '', '']
18049 -- ['', '', '', '', '', '', '']
18050 -- ['', '', '', '', '', '', '']
18051 -- ['', '', '', '', '', '', '']
18052 -- ['', '', '', '', '', '', '']
18053 -- ['', '', '', '', '', '', '']
18054 -- ['', '', '', '', '', '', '']
18055 -- ['', '', '', '', '', '', '']
18056 -- ['', '', '', '', '', '', '']
18057 -- ['', '', '', '', '', '', '']
18058 -- ['', '', '', '', '', '', '']
18059 -- ['', '', '', '', '', '', '']
18060 -- ['', '', '', '', '', '', '']
18061 -- ['', '', '', '', '', '', '']
18062 -- ['', '', '', '', '', '', '']
18063 -- ['', '', '', '', '', '', '']
18064 -- ['', '', '', '', '', '', '']
18065 -- ['', '', '', '', '', '', '']
18066 -- ['', '', '', '', '', '', '']
18067 -- ['', '', '', '', '', '', '']
18068 -- ['', '', '', '', '', '', '']
18069 -- ['', '', '', '', '', '', '']
18070 -- ['', '', '', '', '', '', '']
18071 -- ['', '', '', '', '', '', '']
18072 -- ['', '', '', '', '', '', '']
18073 -- ['', '', '', '', '', '', '']
18074 -- ['', '', '', '', '', '', '']
18075 -- ['', '', '', '', '', '', '']
18076 -- ['', '', '', '', '', '', '']
18077 -- ['', '', '', '', '', '', '']
18078 -- ['', '', '', '', '', '', '']
18079 -- ['', '', '', '', '', '', '']
18080 -- ['', '', '', '', '', '', '']
18081 -- ['', '', '', '', '', '', '']
18082 -- ['', '', '', '', '', '', '']
18083 -- ['', '', '', '', '', '', '']
18084 -- ['', '', '', '', '', '', '']
18085 -- ['', '', '', '', '', '', '']
18086 -- ['', '', '', '', '', '', '']
18087 -- ['', '', '', '', '', '', '']
18088 -- ['', '', '', '', '', '', '']
18089 -- ['', '', '', '', '', '', '']
18090 -- ['', '', '', '', '', '', '']
18091 -- ['', '', '', '', '', '', '']
18092 -- ['', '', '', '', '', '', '']
18093 -- ['', '', '', '', '', '', '']
18094 -- ['', '', '', '', '', '', '']
18095 -- ['', '', '', '', '', '', '']
18096 -- ['', '', '', '', '', '', '']
18097 -- ['', '', '', '', '', '', '']
18098 -- ['', '', '', '', '', '', '']
18099 -- ['', '', '', '', '', '', '']
18100 -- ['', '', '', '', '', '', '']
18101 -- ['', '', '', '', '', '', '']
18102 -- ['', '', '', '', '', '', '']
18103 -- ['', '', '', '', '', '', '']
18104 -- ['', '', '', '', '', '', '']
18105 -- ['', '', '', '', '', '', '']
18106 -- ['', '', '', '', '', '', '']
18107 -- ['', '', '', '', '', '', '']
18108 -- ['', '', '', '', '', '', '']
18109 -- ['', '', '', '', '', '', '']
18110 -- ['', '', '', '', '', '', '']
18111 -- ['', '', '', '', '', '', '']
18112 -- ['', '', '', '', '', '', '']
18113 -- ['', '', '', '', '', '', '']
18114 -- ['', '', '', '', '', '', '']
18115 -- ['', '', '', '', '', '', '']
18116 -- ['', '', '', '', '', '', '']
18117 -- ['', '', '', '', '', '', '']
18118 -- ['', '', '', '', '', '', '']
18119 -- ['', '', '', '', '', '', '']
['', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '']
[7, 6, 10, 6, 8, 8, 13, 2, 8, 7, 7, 9, 7, 7, 5, 9]
[(7, 13), (3, 10), (12, 9), (16, 9), (5, 8), (6, 8), (9, 8), (1, 7), (10, 7), (11, 7), (13, 7), (14, 7), (2, 6), (4, 6), (15, 5), (8, 2)] Process finished with exit code 0
python抓取每期双色球中奖号码,用于分析的更多相关文章
- 初识python 之 爬虫:爬取双色球中奖号码信息
人生还是要有梦想的,毕竟还有python.比如,通过python来搞一搞彩票(双色球).注:此文仅用于python学习,结果仅作参考.用到知识点:1.爬取网页基础数据2.将数据写入excel文件3.将 ...
- Python 抓取网页并提取信息(程序详解)
最近因项目需要用到python处理网页,因此学习相关知识.下面程序使用python抓取网页并提取信息,具体内容如下: #---------------------------------------- ...
- 使用Python抓取猫眼近10万条评论并分析
<一出好戏>讲述人性,使用Python抓取猫眼近10万条评论并分析,一起揭秘“这出好戏”到底如何? 黄渤首次导演的电影<一出好戏>自8月10日在全国上映,至今已有10天,其主演 ...
- 使用 Python 抓取欧洲足球联赛数据
Web Scraping在大数据时代,一切都要用数据来说话,大数据处理的过程一般需要经过以下的几个步骤 数据的采集和获取 数据的清洗,抽取,变形和装载 数据的分析,探索和预测 ...
- python抓取性感尤物美女图
由于是只用标准库,装了python3运行本代码就能下载到多多的美女图... 写出代码前面部分的时候,我意识到自己的函数设计错了,强忍继续把代码写完. 测试发现速度一般,200K左右的下载速度,也没有很 ...
- python抓取网页例子
python抓取网页例子 最近在学习python,刚刚完成了一个网页抓取的例子,通过python抓取全世界所有的学校以及学院的数据,并存为xml文件.数据源是人人网. 因为刚学习python,写的代码 ...
- Python抓取页面中超链接(URL)的三中方法比较(HTMLParser、pyquery、正则表达式) <转>
Python抓取页面中超链接(URL)的3中方法比较(HTMLParser.pyquery.正则表达式) HTMLParser版: #!/usr/bin/python # -*- coding: UT ...
- 如何用python抓取js生成的数据 - SegmentFault
如何用python抓取js生成的数据 - SegmentFault 如何用python抓取js生成的数据 1赞 踩 收藏 想写一个爬虫,但是需要抓去的的数据是js生成的,在源代码里看不到,要怎么才能抓 ...
- 关于python抓取google搜索结果的若干问题
关于python抓取google搜索结果的若干问题 前一段时间一直在研究如何用python抓取搜索引擎结果,在实现的过程中遇到了很多的问题,我把我遇到的问题都记录下来,希望以后遇到同样问题的童 ...
随机推荐
- Golang中设置函数默认参数的优雅实现
在Golang中,我们经常碰到要设置一个函数的默认值,或者说我定义了参数值,但是又不想传递值,这个在python或php一类的语言中很好实现,但Golang中好像这种方法又不行.今天在看Grpc源码时 ...
- python每日经典算法题5(基础题)+1(较难题)
一:基础算法题5道 1.阿姆斯特朗数 如果一个n位正整数等于其各位数字的n次方之和,则称该数为阿姆斯特朗数.判断用户输入的数字是否为阿姆斯特朗数. (1)题目分析:这里要先得到该数是多少位的,然后再把 ...
- 前端开发者必备的Nginx知识
摘要: 最常用的Web服务器 -- Nginx 原文:前端开发者必备的Nginx知识 作者:ConardLi Fundebug经授权转载,版权归原作者所有. Nginx在应用程序中的作用 解决跨域 请 ...
- 《linux就该这么学》课堂笔记18 squid服务
Squid服务程序正向解析和反向解析 正向代理模式不仅可以让用户使用Squid代理服务器上网,还可以基于指定的IP地址.域名关键词.网站地址或下载文件后缀等信息,实现类似于访问控制列表的功能.反向代理 ...
- home_url()用法小结|wordpress函数
home_url()检索可访问当前站点的URL(推荐将<?php bloginfo('url'); ?>用<?php home_url(); ?>来替代),使用适当的协议返回' ...
- html--前端基本标签内容讲解
body里面分为两类标签:块级标签和内联标签. 1.块级标签:<p><h1><table><ol><ul><form><d ...
- [冬令营Day1 T2]sequence
题目描述 Description 给一个长度为N的序列以及Q的询问,每次两个参数l,r,问你序列[l,r]中的最大连续和 输入描述 Input Description 一行二个正整数N,Q. 接下来一 ...
- jdk,jre,jvm,openJdk
1,jdk install: java_home: point to the installation directory of JDK, which is used by some java dev ...
- q1096
一,看题 1,大概是每个点都来一次BFS标记下应该就可以. 2,你可以想想队列为啥pop()是l++; 3,还是字符你得注意下. 4,x,y,m,n,行列你得搞清楚. 5,这棋盘的破东西.. 6,额, ...
- zzulioj - 2597: 角谷猜想2
题目链接: http://acm.zzuli.edu.cn/problem.php?id=2597 题目描述 大家想必都知道角谷猜想,即任何一个自然数,如果是偶数,就除以2,如果是奇数,就乘以3再加1 ...