获取每期双色球中奖号码,便于观察,话不多说,代码如下

# -*- coding:utf-8 -*-
# __author__ :kusy
# __content__:获取每期双色球中奖号码
# __date__:2018/10/12 17:08
import urllib.request
import re class GetApiTxtByRegexp(object):
def __init__(self, url, regexp):
self.url = url
self.regexp = regexp def get_content(self):
page = urllib.request.urlopen(self.url)
content = page.read()
# print(content)
content_reg = re.compile(self.regexp)
list_content = re.findall(content_reg, content.decode('gbk'))
return list_content if __name__ == '__main__':
# 获取每期期号地址(暂时无法直接获取)
# url = 'http://kaijiang.500.com/shtml/ssq/18119.shtml?0_ala_baidu'
# regexp = r'' # url = 'http://kaijiang.500.com/shtml/ssq/18118.shtml'
regexp = r'<li class="ball_.*?">(\d*)</li>'
list_blue = []
for tikitno in range(18000, 18120, 1):
tikitno = str(tikitno)
url = 'http://kaijiang.500.com/shtml/ssq/' + tikitno + '.shtml'
try:
gettxt = GetApiTxtByRegexp(url, regexp)
list_content = gettxt.get_content()
list_blue.append(list_content[-1])
print(tikitno,'--',list_content)
except urllib.error.HTTPError:
pass # 获取各数字篮球出现的次数
list_cnt = [0] * 16
for blue in list_blue:
for i in range(1,17,1):
if int(blue) == i:
list_cnt[i-1] += 1
print(list_blue)
print(list_cnt)
d = dict(zip(list(range(1, 17, 1)), list_cnt))
d = sorted(d.items(), key=lambda x: x[1], reverse=True)
# 篮球出现次数排序
print(d)

结果如下图

E:\kusy\future\venv\Scripts\python.exe E:/kusy/future/double_color_ball.py
18001 -- ['', '', '', '', '', '', '']
18002 -- ['', '', '', '', '', '', '']
18003 -- ['', '', '', '', '', '', '']
18004 -- ['', '', '', '', '', '', '']
18005 -- ['', '', '', '', '', '', '']
18006 -- ['', '', '', '', '', '', '']
18007 -- ['', '', '', '', '', '', '']
18008 -- ['', '', '', '', '', '', '']
18009 -- ['', '', '', '', '', '', '']
18010 -- ['', '', '', '', '', '', '']
18011 -- ['', '', '', '', '', '', '']
18012 -- ['', '', '', '', '', '', '']
18013 -- ['', '', '', '', '', '', '']
18014 -- ['', '', '', '', '', '', '']
18015 -- ['', '', '', '', '', '', '']
18016 -- ['', '', '', '', '', '', '']
18017 -- ['', '', '', '', '', '', '']
18018 -- ['', '', '', '', '', '', '']
18019 -- ['', '', '', '', '', '', '']
18020 -- ['', '', '', '', '', '', '']
18021 -- ['', '', '', '', '', '', '']
18022 -- ['', '', '', '', '', '', '']
18023 -- ['', '', '', '', '', '', '']
18024 -- ['', '', '', '', '', '', '']
18025 -- ['', '', '', '', '', '', '']
18026 -- ['', '', '', '', '', '', '']
18027 -- ['', '', '', '', '', '', '']
18028 -- ['', '', '', '', '', '', '']
18029 -- ['', '', '', '', '', '', '']
18030 -- ['', '', '', '', '', '', '']
18031 -- ['', '', '', '', '', '', '']
18032 -- ['', '', '', '', '', '', '']
18033 -- ['', '', '', '', '', '', '']
18034 -- ['', '', '', '', '', '', '']
18035 -- ['', '', '', '', '', '', '']
18036 -- ['', '', '', '', '', '', '']
18037 -- ['', '', '', '', '', '', '']
18038 -- ['', '', '', '', '', '', '']
18039 -- ['', '', '', '', '', '', '']
18040 -- ['', '', '', '', '', '', '']
18041 -- ['', '', '', '', '', '', '']
18042 -- ['', '', '', '', '', '', '']
18043 -- ['', '', '', '', '', '', '']
18044 -- ['', '', '', '', '', '', '']
18045 -- ['', '', '', '', '', '', '']
18046 -- ['', '', '', '', '', '', '']
18047 -- ['', '', '', '', '', '', '']
18048 -- ['', '', '', '', '', '', '']
18049 -- ['', '', '', '', '', '', '']
18050 -- ['', '', '', '', '', '', '']
18051 -- ['', '', '', '', '', '', '']
18052 -- ['', '', '', '', '', '', '']
18053 -- ['', '', '', '', '', '', '']
18054 -- ['', '', '', '', '', '', '']
18055 -- ['', '', '', '', '', '', '']
18056 -- ['', '', '', '', '', '', '']
18057 -- ['', '', '', '', '', '', '']
18058 -- ['', '', '', '', '', '', '']
18059 -- ['', '', '', '', '', '', '']
18060 -- ['', '', '', '', '', '', '']
18061 -- ['', '', '', '', '', '', '']
18062 -- ['', '', '', '', '', '', '']
18063 -- ['', '', '', '', '', '', '']
18064 -- ['', '', '', '', '', '', '']
18065 -- ['', '', '', '', '', '', '']
18066 -- ['', '', '', '', '', '', '']
18067 -- ['', '', '', '', '', '', '']
18068 -- ['', '', '', '', '', '', '']
18069 -- ['', '', '', '', '', '', '']
18070 -- ['', '', '', '', '', '', '']
18071 -- ['', '', '', '', '', '', '']
18072 -- ['', '', '', '', '', '', '']
18073 -- ['', '', '', '', '', '', '']
18074 -- ['', '', '', '', '', '', '']
18075 -- ['', '', '', '', '', '', '']
18076 -- ['', '', '', '', '', '', '']
18077 -- ['', '', '', '', '', '', '']
18078 -- ['', '', '', '', '', '', '']
18079 -- ['', '', '', '', '', '', '']
18080 -- ['', '', '', '', '', '', '']
18081 -- ['', '', '', '', '', '', '']
18082 -- ['', '', '', '', '', '', '']
18083 -- ['', '', '', '', '', '', '']
18084 -- ['', '', '', '', '', '', '']
18085 -- ['', '', '', '', '', '', '']
18086 -- ['', '', '', '', '', '', '']
18087 -- ['', '', '', '', '', '', '']
18088 -- ['', '', '', '', '', '', '']
18089 -- ['', '', '', '', '', '', '']
18090 -- ['', '', '', '', '', '', '']
18091 -- ['', '', '', '', '', '', '']
18092 -- ['', '', '', '', '', '', '']
18093 -- ['', '', '', '', '', '', '']
18094 -- ['', '', '', '', '', '', '']
18095 -- ['', '', '', '', '', '', '']
18096 -- ['', '', '', '', '', '', '']
18097 -- ['', '', '', '', '', '', '']
18098 -- ['', '', '', '', '', '', '']
18099 -- ['', '', '', '', '', '', '']
18100 -- ['', '', '', '', '', '', '']
18101 -- ['', '', '', '', '', '', '']
18102 -- ['', '', '', '', '', '', '']
18103 -- ['', '', '', '', '', '', '']
18104 -- ['', '', '', '', '', '', '']
18105 -- ['', '', '', '', '', '', '']
18106 -- ['', '', '', '', '', '', '']
18107 -- ['', '', '', '', '', '', '']
18108 -- ['', '', '', '', '', '', '']
18109 -- ['', '', '', '', '', '', '']
18110 -- ['', '', '', '', '', '', '']
18111 -- ['', '', '', '', '', '', '']
18112 -- ['', '', '', '', '', '', '']
18113 -- ['', '', '', '', '', '', '']
18114 -- ['', '', '', '', '', '', '']
18115 -- ['', '', '', '', '', '', '']
18116 -- ['', '', '', '', '', '', '']
18117 -- ['', '', '', '', '', '', '']
18118 -- ['', '', '', '', '', '', '']
18119 -- ['', '', '', '', '', '', '']
['', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '']
[7, 6, 10, 6, 8, 8, 13, 2, 8, 7, 7, 9, 7, 7, 5, 9]
[(7, 13), (3, 10), (12, 9), (16, 9), (5, 8), (6, 8), (9, 8), (1, 7), (10, 7), (11, 7), (13, 7), (14, 7), (2, 6), (4, 6), (15, 5), (8, 2)] Process finished with exit code 0

python抓取每期双色球中奖号码,用于分析的更多相关文章

  1. 初识python 之 爬虫:爬取双色球中奖号码信息

    人生还是要有梦想的,毕竟还有python.比如,通过python来搞一搞彩票(双色球).注:此文仅用于python学习,结果仅作参考.用到知识点:1.爬取网页基础数据2.将数据写入excel文件3.将 ...

  2. Python 抓取网页并提取信息(程序详解)

    最近因项目需要用到python处理网页,因此学习相关知识.下面程序使用python抓取网页并提取信息,具体内容如下: #---------------------------------------- ...

  3. 使用Python抓取猫眼近10万条评论并分析

    <一出好戏>讲述人性,使用Python抓取猫眼近10万条评论并分析,一起揭秘“这出好戏”到底如何? 黄渤首次导演的电影<一出好戏>自8月10日在全国上映,至今已有10天,其主演 ...

  4. 使用 Python 抓取欧洲足球联赛数据

    Web Scraping在大数据时代,一切都要用数据来说话,大数据处理的过程一般需要经过以下的几个步骤    数据的采集和获取    数据的清洗,抽取,变形和装载    数据的分析,探索和预测    ...

  5. python抓取性感尤物美女图

    由于是只用标准库,装了python3运行本代码就能下载到多多的美女图... 写出代码前面部分的时候,我意识到自己的函数设计错了,强忍继续把代码写完. 测试发现速度一般,200K左右的下载速度,也没有很 ...

  6. python抓取网页例子

    python抓取网页例子 最近在学习python,刚刚完成了一个网页抓取的例子,通过python抓取全世界所有的学校以及学院的数据,并存为xml文件.数据源是人人网. 因为刚学习python,写的代码 ...

  7. Python抓取页面中超链接(URL)的三中方法比较(HTMLParser、pyquery、正则表达式) <转>

    Python抓取页面中超链接(URL)的3中方法比较(HTMLParser.pyquery.正则表达式) HTMLParser版: #!/usr/bin/python # -*- coding: UT ...

  8. 如何用python抓取js生成的数据 - SegmentFault

    如何用python抓取js生成的数据 - SegmentFault 如何用python抓取js生成的数据 1赞 踩 收藏 想写一个爬虫,但是需要抓去的的数据是js生成的,在源代码里看不到,要怎么才能抓 ...

  9. 关于python抓取google搜索结果的若干问题

    关于python抓取google搜索结果的若干问题     前一段时间一直在研究如何用python抓取搜索引擎结果,在实现的过程中遇到了很多的问题,我把我遇到的问题都记录下来,希望以后遇到同样问题的童 ...

随机推荐

  1. 开发--Deepin系统安装

    开发|Deepin系统安装 在18小时前,我刚刚萌生了一个将我的笔记本换成linux系统.在18小时后的现在,在我各种试错之后,笔记本已经开始跑起linux了.在科技的时代,只要是想法,都可以试一试. ...

  2. java--Date时间

    Date: 表示特定的瞬间,精确到毫秒,通过方法设定自己所表示的时间,可以表示任意的时间 System.currentTimeMillis() :返回的当前系统时间, 1970-1-1 至今的毫秒数 ...

  3. webpack报错

    webpack-dev-server --inline --progress --config build/webpack.dev.conf.js internal/modules/cjs/loade ...

  4. json方式的面向对象、拖拽

    //json方式的面向对象 var obj= { a:, b:, c:function(){ alert( } } obj.c();//12 //命名空间 var miaov={}; miaov.co ...

  5. 5 LInux系统目录结构

      ls /    显示根目录下的文件 /bin bin是Binary的缩写,这个目录存放着经常使用的命令 /boot 存放的是启动Linux时使用的一些核心文件,包括一些连接文件以及镜像文件 /de ...

  6. js,获取字符串中存在中文的个数

    var RespMemo='1231231617440C01   心存正义        10';   //定义字符串 re = /[\u4E00-\u9FA5]/g; //测试中文字符的正则 var ...

  7. Nginx配置文件 nginx.conf 和default.conf 讲解

    nginx.conf /etc/nginx/nginx.conf ######Nginx配置文件nginx.conf中文详解##### #定义Nginx运行的用户和用户组 user www www; ...

  8. Django 中的缓存问题

    Django 中的缓存问题 简单介绍 ​ 在动态网站中,用户所有的请求,服务器都会去数据库中进行相应的增,删,查,改,渲染模板,执行业务逻辑,最后生成用户看到的页面. ​ 当一个网站的用户访问量很大的 ...

  9. Nginx 反向代理功能-实现http反向代理

    Nginx 反向代理功能-实现http反向代理 作者:尹正杰 版权声明:原创作品,谢绝转载!否则将追究法律责任.

  10. selenium中三大窗口切换

    我们在做UI自动化时,不得不会遇到一些窗口跳转与弹框,在这种的时候如果不进行切换的话,继续执行脚本必然会报错,所以我们就需要用到切换窗口的方法. selenium中主要是三种窗口 Windows窗口 ...