python抓取每期双色球中奖号码,用于分析
获取每期双色球中奖号码,便于观察,话不多说,代码如下
# -*- coding:utf-8 -*-
# __author__ :kusy
# __content__:获取每期双色球中奖号码
# __date__:2018/10/12 17:08
import urllib.request
import re class GetApiTxtByRegexp(object):
def __init__(self, url, regexp):
self.url = url
self.regexp = regexp def get_content(self):
page = urllib.request.urlopen(self.url)
content = page.read()
# print(content)
content_reg = re.compile(self.regexp)
list_content = re.findall(content_reg, content.decode('gbk'))
return list_content if __name__ == '__main__':
# 获取每期期号地址(暂时无法直接获取)
# url = 'http://kaijiang.500.com/shtml/ssq/18119.shtml?0_ala_baidu'
# regexp = r'' # url = 'http://kaijiang.500.com/shtml/ssq/18118.shtml'
regexp = r'<li class="ball_.*?">(\d*)</li>'
list_blue = []
for tikitno in range(18000, 18120, 1):
tikitno = str(tikitno)
url = 'http://kaijiang.500.com/shtml/ssq/' + tikitno + '.shtml'
try:
gettxt = GetApiTxtByRegexp(url, regexp)
list_content = gettxt.get_content()
list_blue.append(list_content[-1])
print(tikitno,'--',list_content)
except urllib.error.HTTPError:
pass # 获取各数字篮球出现的次数
list_cnt = [0] * 16
for blue in list_blue:
for i in range(1,17,1):
if int(blue) == i:
list_cnt[i-1] += 1
print(list_blue)
print(list_cnt)
d = dict(zip(list(range(1, 17, 1)), list_cnt))
d = sorted(d.items(), key=lambda x: x[1], reverse=True)
# 篮球出现次数排序
print(d)
结果如下图
E:\kusy\future\venv\Scripts\python.exe E:/kusy/future/double_color_ball.py
18001 -- ['', '', '', '', '', '', '']
18002 -- ['', '', '', '', '', '', '']
18003 -- ['', '', '', '', '', '', '']
18004 -- ['', '', '', '', '', '', '']
18005 -- ['', '', '', '', '', '', '']
18006 -- ['', '', '', '', '', '', '']
18007 -- ['', '', '', '', '', '', '']
18008 -- ['', '', '', '', '', '', '']
18009 -- ['', '', '', '', '', '', '']
18010 -- ['', '', '', '', '', '', '']
18011 -- ['', '', '', '', '', '', '']
18012 -- ['', '', '', '', '', '', '']
18013 -- ['', '', '', '', '', '', '']
18014 -- ['', '', '', '', '', '', '']
18015 -- ['', '', '', '', '', '', '']
18016 -- ['', '', '', '', '', '', '']
18017 -- ['', '', '', '', '', '', '']
18018 -- ['', '', '', '', '', '', '']
18019 -- ['', '', '', '', '', '', '']
18020 -- ['', '', '', '', '', '', '']
18021 -- ['', '', '', '', '', '', '']
18022 -- ['', '', '', '', '', '', '']
18023 -- ['', '', '', '', '', '', '']
18024 -- ['', '', '', '', '', '', '']
18025 -- ['', '', '', '', '', '', '']
18026 -- ['', '', '', '', '', '', '']
18027 -- ['', '', '', '', '', '', '']
18028 -- ['', '', '', '', '', '', '']
18029 -- ['', '', '', '', '', '', '']
18030 -- ['', '', '', '', '', '', '']
18031 -- ['', '', '', '', '', '', '']
18032 -- ['', '', '', '', '', '', '']
18033 -- ['', '', '', '', '', '', '']
18034 -- ['', '', '', '', '', '', '']
18035 -- ['', '', '', '', '', '', '']
18036 -- ['', '', '', '', '', '', '']
18037 -- ['', '', '', '', '', '', '']
18038 -- ['', '', '', '', '', '', '']
18039 -- ['', '', '', '', '', '', '']
18040 -- ['', '', '', '', '', '', '']
18041 -- ['', '', '', '', '', '', '']
18042 -- ['', '', '', '', '', '', '']
18043 -- ['', '', '', '', '', '', '']
18044 -- ['', '', '', '', '', '', '']
18045 -- ['', '', '', '', '', '', '']
18046 -- ['', '', '', '', '', '', '']
18047 -- ['', '', '', '', '', '', '']
18048 -- ['', '', '', '', '', '', '']
18049 -- ['', '', '', '', '', '', '']
18050 -- ['', '', '', '', '', '', '']
18051 -- ['', '', '', '', '', '', '']
18052 -- ['', '', '', '', '', '', '']
18053 -- ['', '', '', '', '', '', '']
18054 -- ['', '', '', '', '', '', '']
18055 -- ['', '', '', '', '', '', '']
18056 -- ['', '', '', '', '', '', '']
18057 -- ['', '', '', '', '', '', '']
18058 -- ['', '', '', '', '', '', '']
18059 -- ['', '', '', '', '', '', '']
18060 -- ['', '', '', '', '', '', '']
18061 -- ['', '', '', '', '', '', '']
18062 -- ['', '', '', '', '', '', '']
18063 -- ['', '', '', '', '', '', '']
18064 -- ['', '', '', '', '', '', '']
18065 -- ['', '', '', '', '', '', '']
18066 -- ['', '', '', '', '', '', '']
18067 -- ['', '', '', '', '', '', '']
18068 -- ['', '', '', '', '', '', '']
18069 -- ['', '', '', '', '', '', '']
18070 -- ['', '', '', '', '', '', '']
18071 -- ['', '', '', '', '', '', '']
18072 -- ['', '', '', '', '', '', '']
18073 -- ['', '', '', '', '', '', '']
18074 -- ['', '', '', '', '', '', '']
18075 -- ['', '', '', '', '', '', '']
18076 -- ['', '', '', '', '', '', '']
18077 -- ['', '', '', '', '', '', '']
18078 -- ['', '', '', '', '', '', '']
18079 -- ['', '', '', '', '', '', '']
18080 -- ['', '', '', '', '', '', '']
18081 -- ['', '', '', '', '', '', '']
18082 -- ['', '', '', '', '', '', '']
18083 -- ['', '', '', '', '', '', '']
18084 -- ['', '', '', '', '', '', '']
18085 -- ['', '', '', '', '', '', '']
18086 -- ['', '', '', '', '', '', '']
18087 -- ['', '', '', '', '', '', '']
18088 -- ['', '', '', '', '', '', '']
18089 -- ['', '', '', '', '', '', '']
18090 -- ['', '', '', '', '', '', '']
18091 -- ['', '', '', '', '', '', '']
18092 -- ['', '', '', '', '', '', '']
18093 -- ['', '', '', '', '', '', '']
18094 -- ['', '', '', '', '', '', '']
18095 -- ['', '', '', '', '', '', '']
18096 -- ['', '', '', '', '', '', '']
18097 -- ['', '', '', '', '', '', '']
18098 -- ['', '', '', '', '', '', '']
18099 -- ['', '', '', '', '', '', '']
18100 -- ['', '', '', '', '', '', '']
18101 -- ['', '', '', '', '', '', '']
18102 -- ['', '', '', '', '', '', '']
18103 -- ['', '', '', '', '', '', '']
18104 -- ['', '', '', '', '', '', '']
18105 -- ['', '', '', '', '', '', '']
18106 -- ['', '', '', '', '', '', '']
18107 -- ['', '', '', '', '', '', '']
18108 -- ['', '', '', '', '', '', '']
18109 -- ['', '', '', '', '', '', '']
18110 -- ['', '', '', '', '', '', '']
18111 -- ['', '', '', '', '', '', '']
18112 -- ['', '', '', '', '', '', '']
18113 -- ['', '', '', '', '', '', '']
18114 -- ['', '', '', '', '', '', '']
18115 -- ['', '', '', '', '', '', '']
18116 -- ['', '', '', '', '', '', '']
18117 -- ['', '', '', '', '', '', '']
18118 -- ['', '', '', '', '', '', '']
18119 -- ['', '', '', '', '', '', '']
['', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '']
[7, 6, 10, 6, 8, 8, 13, 2, 8, 7, 7, 9, 7, 7, 5, 9]
[(7, 13), (3, 10), (12, 9), (16, 9), (5, 8), (6, 8), (9, 8), (1, 7), (10, 7), (11, 7), (13, 7), (14, 7), (2, 6), (4, 6), (15, 5), (8, 2)] Process finished with exit code 0
python抓取每期双色球中奖号码,用于分析的更多相关文章
- 初识python 之 爬虫:爬取双色球中奖号码信息
人生还是要有梦想的,毕竟还有python.比如,通过python来搞一搞彩票(双色球).注:此文仅用于python学习,结果仅作参考.用到知识点:1.爬取网页基础数据2.将数据写入excel文件3.将 ...
- Python 抓取网页并提取信息(程序详解)
最近因项目需要用到python处理网页,因此学习相关知识.下面程序使用python抓取网页并提取信息,具体内容如下: #---------------------------------------- ...
- 使用Python抓取猫眼近10万条评论并分析
<一出好戏>讲述人性,使用Python抓取猫眼近10万条评论并分析,一起揭秘“这出好戏”到底如何? 黄渤首次导演的电影<一出好戏>自8月10日在全国上映,至今已有10天,其主演 ...
- 使用 Python 抓取欧洲足球联赛数据
Web Scraping在大数据时代,一切都要用数据来说话,大数据处理的过程一般需要经过以下的几个步骤 数据的采集和获取 数据的清洗,抽取,变形和装载 数据的分析,探索和预测 ...
- python抓取性感尤物美女图
由于是只用标准库,装了python3运行本代码就能下载到多多的美女图... 写出代码前面部分的时候,我意识到自己的函数设计错了,强忍继续把代码写完. 测试发现速度一般,200K左右的下载速度,也没有很 ...
- python抓取网页例子
python抓取网页例子 最近在学习python,刚刚完成了一个网页抓取的例子,通过python抓取全世界所有的学校以及学院的数据,并存为xml文件.数据源是人人网. 因为刚学习python,写的代码 ...
- Python抓取页面中超链接(URL)的三中方法比较(HTMLParser、pyquery、正则表达式) <转>
Python抓取页面中超链接(URL)的3中方法比较(HTMLParser.pyquery.正则表达式) HTMLParser版: #!/usr/bin/python # -*- coding: UT ...
- 如何用python抓取js生成的数据 - SegmentFault
如何用python抓取js生成的数据 - SegmentFault 如何用python抓取js生成的数据 1赞 踩 收藏 想写一个爬虫,但是需要抓去的的数据是js生成的,在源代码里看不到,要怎么才能抓 ...
- 关于python抓取google搜索结果的若干问题
关于python抓取google搜索结果的若干问题 前一段时间一直在研究如何用python抓取搜索引擎结果,在实现的过程中遇到了很多的问题,我把我遇到的问题都记录下来,希望以后遇到同样问题的童 ...
随机推荐
- Spring.yml配置文件读取字符串出现错误
今天遇到一个诡异的问题,在配置文件中配置了一个值为字符串的属性,但是在用@Value注入时发现注入的值不是我配置的值,而且在全文都没有找到匹配的值 之后研究了好久,发现yml文件会把0开头的数组进行8 ...
- Python基础13
<玩1>中关于病假.事假的问题,说得不完全正确. 实际为哑变量. 有关看待问题的维度.出发点(即屁股在哪里) 转哑变量后可以提高模型精度. 机器学习不怕字段过多. 转哑变量是在增维.
- 前端通过js获取微信公众号用户的唯一标识符openId
微信公众号程序开发的时候,获取用户信息的时候,需要用到用户的openId,openId是微信用户的唯一标识符,这个操作可以后台实现也可以前端实现,之前项目里是通过后台来获取的,好像用到了一些三方的包, ...
- Spring Boot 使用 JWT 进行身份和权限验证
上周写了一个 适合初学者入门 Spring Security With JWT 的 Demo,这篇文章主要是对代码中涉及到的比较重要的知识点的说明. 适合初学者入门 Spring Security W ...
- 适合新手入门Spring Security With JWT的Demo
Demo 地址:https://github.com/Snailclimb/spring-security-jwt-guide .欢迎 star! Spring Security 是Spring 全家 ...
- English--元音
English|元音 在一开始学习英语的时候,最需要掌握的就是音标.所以需要从音标的元音开始,并且不局限于掌握音标的元音与辅音,大家可以参考下英文版发音课,并不知道只学习元音与辅音,还有各种弱读连读等 ...
- Gin-Go学习笔记三:Gin-Web框架 JS分页
JS 分页 1> JS分页,业务逻辑 (1) 分页采用的是一个叫jquery.pagination.js的一个jquery插件 (2) 需要jquery的支持,此项目中使 ...
- 将积累多年的java学习资料,pdf文档给大家分享一下,比如《大话设计模式》《算法》《Linux私房菜》等等
话不多说,资料目录如下,需要的拿走,下载的同时别忘了点下推荐. 需要的点下面链接,到小编网盘进行下载: 2-大话设计模式.pdf 链接:https://pan.baidu.com/s/1b05puNO ...
- Ubuntu 出现access denied by server while mounting
3516cv500板端nfst调试时如此配置 虚拟机: #vi /etc/exports 添加 /home/"待分享文件路径" *(rw,sync,no_root_squas ...
- Java多线程编程核心技术-第4章-Lock的使用-读书笔记
第 4 章 Lock 的使用 本章主要内容 ReentrantLocal 类的使用. ReentrantReadWriteLock 类的使用. 4.1 使用 ReentrantLock 类 在 Jav ...