获取每期双色球中奖号码,便于观察,话不多说,代码如下

# -*- coding:utf-8 -*-
# __author__ :kusy
# __content__:获取每期双色球中奖号码
# __date__:2018/10/12 17:08
import urllib.request
import re class GetApiTxtByRegexp(object):
def __init__(self, url, regexp):
self.url = url
self.regexp = regexp def get_content(self):
page = urllib.request.urlopen(self.url)
content = page.read()
# print(content)
content_reg = re.compile(self.regexp)
list_content = re.findall(content_reg, content.decode('gbk'))
return list_content if __name__ == '__main__':
# 获取每期期号地址(暂时无法直接获取)
# url = 'http://kaijiang.500.com/shtml/ssq/18119.shtml?0_ala_baidu'
# regexp = r'' # url = 'http://kaijiang.500.com/shtml/ssq/18118.shtml'
regexp = r'<li class="ball_.*?">(\d*)</li>'
list_blue = []
for tikitno in range(18000, 18120, 1):
tikitno = str(tikitno)
url = 'http://kaijiang.500.com/shtml/ssq/' + tikitno + '.shtml'
try:
gettxt = GetApiTxtByRegexp(url, regexp)
list_content = gettxt.get_content()
list_blue.append(list_content[-1])
print(tikitno,'--',list_content)
except urllib.error.HTTPError:
pass # 获取各数字篮球出现的次数
list_cnt = [0] * 16
for blue in list_blue:
for i in range(1,17,1):
if int(blue) == i:
list_cnt[i-1] += 1
print(list_blue)
print(list_cnt)
d = dict(zip(list(range(1, 17, 1)), list_cnt))
d = sorted(d.items(), key=lambda x: x[1], reverse=True)
# 篮球出现次数排序
print(d)

结果如下图

E:\kusy\future\venv\Scripts\python.exe E:/kusy/future/double_color_ball.py
18001 -- ['', '', '', '', '', '', '']
18002 -- ['', '', '', '', '', '', '']
18003 -- ['', '', '', '', '', '', '']
18004 -- ['', '', '', '', '', '', '']
18005 -- ['', '', '', '', '', '', '']
18006 -- ['', '', '', '', '', '', '']
18007 -- ['', '', '', '', '', '', '']
18008 -- ['', '', '', '', '', '', '']
18009 -- ['', '', '', '', '', '', '']
18010 -- ['', '', '', '', '', '', '']
18011 -- ['', '', '', '', '', '', '']
18012 -- ['', '', '', '', '', '', '']
18013 -- ['', '', '', '', '', '', '']
18014 -- ['', '', '', '', '', '', '']
18015 -- ['', '', '', '', '', '', '']
18016 -- ['', '', '', '', '', '', '']
18017 -- ['', '', '', '', '', '', '']
18018 -- ['', '', '', '', '', '', '']
18019 -- ['', '', '', '', '', '', '']
18020 -- ['', '', '', '', '', '', '']
18021 -- ['', '', '', '', '', '', '']
18022 -- ['', '', '', '', '', '', '']
18023 -- ['', '', '', '', '', '', '']
18024 -- ['', '', '', '', '', '', '']
18025 -- ['', '', '', '', '', '', '']
18026 -- ['', '', '', '', '', '', '']
18027 -- ['', '', '', '', '', '', '']
18028 -- ['', '', '', '', '', '', '']
18029 -- ['', '', '', '', '', '', '']
18030 -- ['', '', '', '', '', '', '']
18031 -- ['', '', '', '', '', '', '']
18032 -- ['', '', '', '', '', '', '']
18033 -- ['', '', '', '', '', '', '']
18034 -- ['', '', '', '', '', '', '']
18035 -- ['', '', '', '', '', '', '']
18036 -- ['', '', '', '', '', '', '']
18037 -- ['', '', '', '', '', '', '']
18038 -- ['', '', '', '', '', '', '']
18039 -- ['', '', '', '', '', '', '']
18040 -- ['', '', '', '', '', '', '']
18041 -- ['', '', '', '', '', '', '']
18042 -- ['', '', '', '', '', '', '']
18043 -- ['', '', '', '', '', '', '']
18044 -- ['', '', '', '', '', '', '']
18045 -- ['', '', '', '', '', '', '']
18046 -- ['', '', '', '', '', '', '']
18047 -- ['', '', '', '', '', '', '']
18048 -- ['', '', '', '', '', '', '']
18049 -- ['', '', '', '', '', '', '']
18050 -- ['', '', '', '', '', '', '']
18051 -- ['', '', '', '', '', '', '']
18052 -- ['', '', '', '', '', '', '']
18053 -- ['', '', '', '', '', '', '']
18054 -- ['', '', '', '', '', '', '']
18055 -- ['', '', '', '', '', '', '']
18056 -- ['', '', '', '', '', '', '']
18057 -- ['', '', '', '', '', '', '']
18058 -- ['', '', '', '', '', '', '']
18059 -- ['', '', '', '', '', '', '']
18060 -- ['', '', '', '', '', '', '']
18061 -- ['', '', '', '', '', '', '']
18062 -- ['', '', '', '', '', '', '']
18063 -- ['', '', '', '', '', '', '']
18064 -- ['', '', '', '', '', '', '']
18065 -- ['', '', '', '', '', '', '']
18066 -- ['', '', '', '', '', '', '']
18067 -- ['', '', '', '', '', '', '']
18068 -- ['', '', '', '', '', '', '']
18069 -- ['', '', '', '', '', '', '']
18070 -- ['', '', '', '', '', '', '']
18071 -- ['', '', '', '', '', '', '']
18072 -- ['', '', '', '', '', '', '']
18073 -- ['', '', '', '', '', '', '']
18074 -- ['', '', '', '', '', '', '']
18075 -- ['', '', '', '', '', '', '']
18076 -- ['', '', '', '', '', '', '']
18077 -- ['', '', '', '', '', '', '']
18078 -- ['', '', '', '', '', '', '']
18079 -- ['', '', '', '', '', '', '']
18080 -- ['', '', '', '', '', '', '']
18081 -- ['', '', '', '', '', '', '']
18082 -- ['', '', '', '', '', '', '']
18083 -- ['', '', '', '', '', '', '']
18084 -- ['', '', '', '', '', '', '']
18085 -- ['', '', '', '', '', '', '']
18086 -- ['', '', '', '', '', '', '']
18087 -- ['', '', '', '', '', '', '']
18088 -- ['', '', '', '', '', '', '']
18089 -- ['', '', '', '', '', '', '']
18090 -- ['', '', '', '', '', '', '']
18091 -- ['', '', '', '', '', '', '']
18092 -- ['', '', '', '', '', '', '']
18093 -- ['', '', '', '', '', '', '']
18094 -- ['', '', '', '', '', '', '']
18095 -- ['', '', '', '', '', '', '']
18096 -- ['', '', '', '', '', '', '']
18097 -- ['', '', '', '', '', '', '']
18098 -- ['', '', '', '', '', '', '']
18099 -- ['', '', '', '', '', '', '']
18100 -- ['', '', '', '', '', '', '']
18101 -- ['', '', '', '', '', '', '']
18102 -- ['', '', '', '', '', '', '']
18103 -- ['', '', '', '', '', '', '']
18104 -- ['', '', '', '', '', '', '']
18105 -- ['', '', '', '', '', '', '']
18106 -- ['', '', '', '', '', '', '']
18107 -- ['', '', '', '', '', '', '']
18108 -- ['', '', '', '', '', '', '']
18109 -- ['', '', '', '', '', '', '']
18110 -- ['', '', '', '', '', '', '']
18111 -- ['', '', '', '', '', '', '']
18112 -- ['', '', '', '', '', '', '']
18113 -- ['', '', '', '', '', '', '']
18114 -- ['', '', '', '', '', '', '']
18115 -- ['', '', '', '', '', '', '']
18116 -- ['', '', '', '', '', '', '']
18117 -- ['', '', '', '', '', '', '']
18118 -- ['', '', '', '', '', '', '']
18119 -- ['', '', '', '', '', '', '']
['', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '']
[7, 6, 10, 6, 8, 8, 13, 2, 8, 7, 7, 9, 7, 7, 5, 9]
[(7, 13), (3, 10), (12, 9), (16, 9), (5, 8), (6, 8), (9, 8), (1, 7), (10, 7), (11, 7), (13, 7), (14, 7), (2, 6), (4, 6), (15, 5), (8, 2)] Process finished with exit code 0

python抓取每期双色球中奖号码,用于分析的更多相关文章

  1. 初识python 之 爬虫:爬取双色球中奖号码信息

    人生还是要有梦想的,毕竟还有python.比如,通过python来搞一搞彩票(双色球).注:此文仅用于python学习,结果仅作参考.用到知识点:1.爬取网页基础数据2.将数据写入excel文件3.将 ...

  2. Python 抓取网页并提取信息(程序详解)

    最近因项目需要用到python处理网页,因此学习相关知识.下面程序使用python抓取网页并提取信息,具体内容如下: #---------------------------------------- ...

  3. 使用Python抓取猫眼近10万条评论并分析

    <一出好戏>讲述人性,使用Python抓取猫眼近10万条评论并分析,一起揭秘“这出好戏”到底如何? 黄渤首次导演的电影<一出好戏>自8月10日在全国上映,至今已有10天,其主演 ...

  4. 使用 Python 抓取欧洲足球联赛数据

    Web Scraping在大数据时代,一切都要用数据来说话,大数据处理的过程一般需要经过以下的几个步骤    数据的采集和获取    数据的清洗,抽取,变形和装载    数据的分析,探索和预测    ...

  5. python抓取性感尤物美女图

    由于是只用标准库,装了python3运行本代码就能下载到多多的美女图... 写出代码前面部分的时候,我意识到自己的函数设计错了,强忍继续把代码写完. 测试发现速度一般,200K左右的下载速度,也没有很 ...

  6. python抓取网页例子

    python抓取网页例子 最近在学习python,刚刚完成了一个网页抓取的例子,通过python抓取全世界所有的学校以及学院的数据,并存为xml文件.数据源是人人网. 因为刚学习python,写的代码 ...

  7. Python抓取页面中超链接(URL)的三中方法比较(HTMLParser、pyquery、正则表达式) <转>

    Python抓取页面中超链接(URL)的3中方法比较(HTMLParser.pyquery.正则表达式) HTMLParser版: #!/usr/bin/python # -*- coding: UT ...

  8. 如何用python抓取js生成的数据 - SegmentFault

    如何用python抓取js生成的数据 - SegmentFault 如何用python抓取js生成的数据 1赞 踩 收藏 想写一个爬虫,但是需要抓去的的数据是js生成的,在源代码里看不到,要怎么才能抓 ...

  9. 关于python抓取google搜索结果的若干问题

    关于python抓取google搜索结果的若干问题     前一段时间一直在研究如何用python抓取搜索引擎结果,在实现的过程中遇到了很多的问题,我把我遇到的问题都记录下来,希望以后遇到同样问题的童 ...

随机推荐

  1. Linux组管理(6)

    在linux中每个用户必须属于一个组,不能独立于组外.在linux中每个文件有所有者.所在组.其它组的概念. 文件/目录的所有者:一般为文件的创建者,谁创建了该文件,就自然成为该文件的所有者 查看文件 ...

  2. html5新增表单控件和表单属性

    表单验证 Invalid事件 : 验证反馈 input.addEventListener('invalid',fn,false) 阻止默认验证:ev.preventDefault() formnova ...

  3. Java内存泄漏解析!

    前言: 内存管理是Java最重要的优势之一,你只需创建对象,Java垃圾收集器会自动负责分配和释放内存.但是,情况并不那么简单,因为在Java应用程序中经常发生内存泄漏. 本章会说明什么是内存泄漏,为 ...

  4. Windows 2016 & Windows 10 中IIS安装和配置PHP的步骤

    Windows 2016 和 Windows 10 内核是相同的,我们首先需要安装 Internet Information Services (IIS),当然 Win2016 跟 Win10 安装  ...

  5. Fork/Join框架与Java8 Stream API 之并行流的速度比较

    Fork/Join 框架有特定的ExecutorService和线程池构成.ExecutorService可以运行任务,并且这个任务会被分解成较小的任务,它们从线程池中被fork(被不同的线程执行)出 ...

  6. 详解数据库引擎与SQL语句增删改查(非常详细,带例)

    数据库系统(DBMS): 专门负责数据管理的工具.增加数据.创建索引.建立索引之间的关联关系.更新索引...... 连接器:PHP要访问MySQL,可以通过API访问,也可以通过PHP的驱动,而那个驱 ...

  7. yum lockfile is held by another process

    使用yum安装软件报错 yum lockfile is held by another process 解决方法 rm -f /var/run/yum.pid

  8. ubuntu gitclone下载的文件放哪里了

    在home主文件夹里面.

  9. java http get和post请求

    1.http工具类 package com.funshion.common.utils; import java.net.URI;import java.net.URL; import org.apa ...

  10. gulp babel 配置不报错也没有输出结果的原因

    环境: "@babel/core": "^7.1.6", "gulp-babel": "^8.0.0", "@ ...