描述性统计Python实现

这周学习时间也就几个小时,由于python也正在学习,Anaconda也有,所以那些安装啥的就偷懒下不写了,直接贴出python代码

数据是随机生成,计算是调用库里的函数。

经过第一周的学习,对描述性统计有了比较深的理解,不过部分公式却是没太弄明白,希望自己继续努力。

其实,这周因为一些琐事差点放弃继续做作业,还好坚持了,希望自己不要放弃,坚持到底,加油!

其中的理论知识可以到https://www.cnblogs.com/-feng/p/11220643.html去看

实例代码

import numpy as np
import pandas as pd
from scipy import stats# 创建随机序列:
data = np.random.randint(10,50,1000)
data1 = pd.Series(data)
# 求众数
mod = data1.mode()[0]
# 求中位数
med = data1.median()
# 分位数,以四分位为例
Q1 = data1.quantile(0.25)
Q2 = data1.quantile(0.5)
Q3 = data1.quantile(0.75)
# 算术平均
mean = data1.mean()
# 加权平均
# 随机权重数组
qs = np.random.rand(data1.count())
tmp = data1*qs/qs.sum()
qm = tmp.sum()
# 几何平均
gmean=stats.gmean(data1)
# 方差
var = data1.var()
# 标准差
std = data1.std()
# 极差
range = data1.max() - data1.min()
# 平均差
mean_d = np.abs(data1 - data1.mean()).mean()
# 四分位差
Qd = Q3 - Q1
# 异众比率
vr = 1 - data1.value_counts()[data1.mode()].sum() / data1.count()
# 离散系数
v = std / mean
# 峰态系数
kur = stats.kurtosis(data1)
# 偏态系数
Cs = stats.skew(data1)
print('众数:{0};中位数:{1};\n四分位:\n第一分位Q1:{2};第二分位Q2:{3};第三分位Q3:{4};'
'\n算术平均:{5};加权平均数:{6};几何平均数:{7} ;\n方差:{8};标准差:{9};极差:{10};'
'平均差:{11};四分位差:{12};\n异众比率:{13};离散系数:{14};\n峰态系数:{15};偏态系数;{16}'
.format(mod, med, Q1, Q2, Q3, mean, qm, gmean, var, std, range, mean_d, Qd, vr, v, kur, Cs))
print('样本总数:',data1.shape[0])

实验结果

数据分析second week(7.22~7.28)的更多相关文章

  1. 2019年1月16日22:50:28 白糖SR1905

    很好的机会,只拿了点皮毛,如果说都是因为上班时间不充裕那是给自己找借口,最主要原因没别的:思维不清,策略不明- 这里的入场初衷是周线区间下沿,日线向下脱离中枢失败后回拉一笔,那么这一单的做法就应该很明 ...

  2. 《linux内核分析》第一周(2.22~2.28)

    潘恒   原创作品转载请注明出处  <Linux内核分析>MOOC课程http://mooc.study.163.com/course/USTC-1000029000 计算机是如何工作的? ...

  3. 10.22~10.28一周经典题目整理(meeting,BZOJ4377,POJ3659)

    meeting:给正n边形每个点染上黑色或者白色,问有多少个同色的等腰三角形. 以正五边形为例这里将最上面的点作为顶点,得到若干对相等的腰 ,注意到以最上面的点作为顶点的等腰三角形的个数,等于颜色相等 ...

  4. python 数据分析2

    本节概要 Numpy详解 安装 Numpy的安装已经不想多说..在确保pip或pip3的路径被添加到系统环境变量里面之后,就可以直接用下面语句进行安装. pip install numpy or pi ...

  5. Pandas学习(二)——双色球开奖数据分析

    学习笔记汇总 Pandas学习(一)–数据的导入 pandas学习(二)–双色球数据分析 pandas学习(三)–NAB球员薪资分析 pandas学习(四)–数据的归一化 pandas学习(五)–pa ...

  6. 小白学 Python(22):time 和 calendar 模块简单使用

    人生苦短,我选Python 前文传送门 小白学 Python(1):开篇 小白学 Python(2):基础数据类型(上) 小白学 Python(3):基础数据类型(下) 小白学 Python(4):变 ...

  7. Log4J 使用实战

    前言: 日志在开发和服务中扮演重要的角色, 有人用来追查/分析问题, 有人通过日志, 来记录重要的信息. 日志是数据分析和统计最重要的数据来源. 在Java领域, Log4j日志框架成为java开发人 ...

  8. matplotlib学习之绘图基础

    matplotlib:http://www.cnblogs.com/jasonhaven/p/7609059.html 1.基本图形 散点图:显示两组数据的值,每个点的坐标位置由变量的值决定,头一组不 ...

  9. pandas用法小结

    前言 个人感觉网上对pandas的总结感觉不够详尽细致,在这里我对pandas做个相对细致的小结吧,在数据分析与人工智能方面会有所涉及到的东西在这里都说说吧,也是对自己学习的一种小结! pandas用 ...

随机推荐

  1. Java入门基础学习,成为一个Java程序员的必备知识

    引言 众所周知,Java是一种面向对象的编程语言.您可以在Windows操作系统上编写Java源代码,而在Linux操作系统上运行编译后的字节码,而无需修改源代码. 数据类型 Java 有 2 种数据 ...

  2. java 面向对象(十八):包装类的使用

    1.为什么要有包装类(或封装类)为了使基本数据类型的变量具有类的特征,引入包装类. 2.基本数据类型与对应的包装类: 3.需要掌握的类型间的转换:(基本数据类型.包装类.String) 简易版:基本数 ...

  3. python之爬虫(九)PyQuery库的使用

    PyQuery库也是一个非常强大又灵活的网页解析库,如果你有前端开发经验的,都应该接触过jQuery,那么PyQuery就是你非常绝佳的选择,PyQuery 是 Python 仿照 jQuery 的严 ...

  4. 关于PowerShell调用Linq的一组实验

    Windows PowerShell 版权所有 (C) Microsoft Corporation.保留所有权利. 尝试新的跨平台 PowerShell https://aka.ms/pscore6 ...

  5. Mysql UDF提权方法

    0x01 UDF UDF(user defined function)用户自定义函数,是mysql的一个拓展接口.用户可以通过自定义函数实现在mysql中无法方便实现的功能,其添加的新函数都可以在sq ...

  6. sql中in和exists的原理及使用场景。

    在我们的工作中可能会遇到这样的情形: 我们需要查询a表里面的数据,但是要以b表作为约束. 举个例子,比如我们需要查询订单表中的数据,但是要以用户表为约束,也就是查询出来的订单的user_id要在用户表 ...

  7. Shell基本语法---处理海量数据的awk命令

    awk命令 其实是一门编程语言,支持条件判断,数组,循环等功能,与grep,sed被称为linux三剑客 之所以叫AWK是因为取其三位创始人 Alfred Aho,Peter Weinberger, ...

  8. Shell基本语法---处理海量数据的cut命令

    cut命令 cut应用场景:通常对数据进行列的提取 语法:cut [选项] [file] -d #指定分割符 -f #指定截取区域 -c #以字符为单位进行分割 # 以':'为分隔符,截取出/etc/ ...

  9. 关于虎信如何绑定二次验证码_虚拟MFA_两步验证_谷歌身份验证器?

    一般点账户名——设置——安全设置中开通虚拟MFA两步验证 具体步骤见链接 虎信如何绑定二次验证码_虚拟MFA_两步验证_谷歌身份验证器? 二次验证码小程序于谷歌身份验证器APP的优势 1.无需下载ap ...

  10. springboot(4)Druid作为项目数据源(添加监控)

    参考博客:恒宇少年:https://www.jianshu.com/p/e84e2709f383 Druid简介 Druid是一个关系型数据库连接池,它是阿里巴巴的一个开源项目.Druid支持所有JD ...