Python数据分析之双色球高频数据统计

Step1：基础数据准备（通过爬虫获取到），以下是从第一期03年双色球开奖号到今天的所有数据整理，截止目前一共2549期，balls.txt 文件内容如下：

备注：想要现成数据的可以给我发邮件哟~

Step2: 分析数据特征和数据处理方式选择，直接上代码如下：

#导入Counter
from collections import Counter

def readfile():
red_lists=[]
blue_lists=[]
#打开文件并获取文件句柄
with open("./balls.txt", "r",encoding='utf-8') as fp:
#开始读取文件并返回一个list
    list1=fp.readlines()
    #遍历整个文件内容
for i in range(len(list1)):
#替换掉\n的字符再按空格分隔
        list2=str(list1[i]).replace("\n","").split(" ")
for j in range(len(list2)):
if j==6:
#蓝球放入到blue_lists 列表中
               blue_lists.append(list2[j])
            else:
             #红球放入到red_lists 列表中
               red_lists.append(list2[j])
        #Counter可以快速便捷的对某些对象做一些统计操作,这里是对列表里面的数据进行出现次数统计，返回一个tuple
red_count=Counter(red_lists)
blue_count=Counter(blue_lists)
#most_common可以用来统计列表或字符串中最常出现的元素并做排序，并返回一个list
k = red_count.most_common(len(red_count))
#输出出现频率最高的六个红球
print("the red ball:",k[:6])
l = blue_count.most_common(len(blue_count))
#输出出现频率最高的六个蓝球
print("the blue ball:",l[:6])

if __name__=="__main__":
readfile()

Step3：执行结果如下：

Step4：执行结果验证:

从官网获取的数据进行对比，一致性校验通过。

总结：python在数据处理方面有着非常强大的优势，其实早先用过Panda库也可以非常出色的完成双色球的数据统计，大家有兴趣的可以实验一下。

备注：我的个人公众号已正式开通，致力于测试技术的分享，包含：大数据测试、功能测试，测试开发，API接口自动化、测试运维、UI自动化测试等，微信搜索公众号：“无量测试之道”，或扫描下方二维码：

添加关注，一起共同成长吧。

Python数据分析之双色球高频数据统计的更多相关文章

Python数据分析：大众点评数据进行选址
前言本文的文字及图片来源于网络,仅供学习.交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理. 作者:砂糖侠如果你处于想学Python或者正在学习Python,Pyth ...
Python 数据分析 - 索引和选择数据
loc,iloc,ix三者间的区别和联系 loc .loc is primarily label based, but may also be used with a boolean array. 就 ...
python数据分析之csv/txt数据的导入和保存
约定: import numpy as np import pandas as pd 1 2 3 一.CSV数据的导入和保存 csv数据一般格式为逗号分隔,可在excel中打开展示. 示例 data1 ...
Python数据分析之文本处理词频统计
1.项目背景: 原本计划着爬某房产网站的数据做点分析, 结果数据太烂了,链家网的数据干净点, 但都是新开楼盘,没有时间维度,分析意义不大. 学习的步伐不能ting,自然语言处理还的go on 2.分析 ...
python数据分析第二版：数据加载，存储和格式
一:读取数据的函数 1.读取csv文件 import numpy as np import pandas as pd data = pd.read_csv("C:\\Users\\Admin ...
Python数据分析之全球人口数据
这篇文章用pandas对全球的人口数据做个简单分析.我收集全球各国1960-2019年人口数据,包含男女和不同年龄段,共6个文件. pop_total.csv: 各国每年总人口 pop_female. ...
Python 数据分析—第七章数据归整：清理、转换、合并、重塑
一.数据库风格的Dataframe合并 import pandas as pd import numpy as np df1 = pd.DataFrame({'1key':['b','b','a',' ...
【python数据分析实战】电影票房数据分析(二)数据可视化
目录图1 每年的月票房走势图图2 年票房总值.上映影片总数及观影人次图3 单片总票房及日均票房图4 单片票房及上映月份关系图在上一部分<[python数据分析实战]电影票房数据分析(一 ...
小白学 Python 数据分析（5）：Pandas （四）基础操作（1）查看数据
在家为国家做贡献太无聊,不如跟我一起学点 Python 人生苦短,我用 Python 前文传送门: 小白学 Python 数据分析(1):数据分析基础小白学 Python 数据分析(2):Panda ...

随机推荐

C/C++数组和指针详解
/****************************************************************/ /* 学习是合作和分享式的! /* Auth ...
2018-06-25 js表单事件、三个高度和Ajax异步通讯技术
表单事件: onfocus -> 表单控件得到焦点时触发: obj_ipt.onfocus=function(){}; onblur -> 表单控件失去焦点时: onchange -> ...
Node教程——API接口开发(Node版的CRUD通用接口的搭建）（MangoDB+Express_Version2）
1. 概述时间跨度有点大,之前就跟大家唠嗑过一些知识点,也开启了一个Node书写一个后台api项目的开始,出于各种原因,迟迟没有更新博文.现在我把这个坑填上,如果你还有阅读过我之前的文章,我建议你先 ...
Appium自动化（4） - Appium Desired Capabilities 参数详解
如果你还想从头学起Appium,可以看看这个系列的文章哦! https://www.cnblogs.com/poloyy/category/1693896.html Desired Capabilit ...
CF808E Selling Souvenirs
题目链接: http://codeforces.com/contest/808/problem/E 题目大意: Petya 有 n 个纪念品,他能带的最大的重量为 m,各个纪念品的重量为 wi,花费为 ...
Istio-架构
读书笔记整理工作机制:分为控制面和数据面控制面:Pilot, Mixer(接收来自Envoy上报的数据), Citadel(证书和密钥管理) 数据面:Envoy 工作流程: 自动注入应用程序启动 ...
Redis详解（十）------ 从零开始搭建集群
在上一篇博客我们介绍了------Redis哨兵(Sentinel)模式,哨兵模式主要是解决高可用问题,在master节点宕机时,slave节点能够自动切换成为master节点本篇博客我们来介绍Re ...
Java IO（八） PipedInputStream 和 PipedOutputStream
Java IO(八) PipedInputStream 和 PipedOutputStream 一.介绍 PipedInputStream 和 PipedOutputStream 是管道输入流和管道输 ...
【算法】单元最短路径之Bellman-Ford算法和SPFA算法
SPFA是经过对列优化的bellman-Ford算法,因此,在学习SPFA算法之前,先学习下bellman-Ford算法. bellman-Ford算法是一种通过松弛操作计算最短路的算法. 适用条件 ...
doReleaseShared源码分析及唤醒后继节点的过程分析
文章结构源码:对doReleaseShared()方法的源码进行一些注释使用场景:介绍doReleaseShared()使用位置,及目的以写锁开始的队列:分析写锁开始得同步等待队列在唤醒后续读锁 ...

Python数据分析之双色球高频数据统计

Python数据分析之双色球高频数据统计的更多相关文章

随机推荐

热门专题