应用统计学

对类别数据要分类处理:

Bar chart复式条形图便于对比:

Pareto chart:对类别变量依据频数高低排列:

Pie chart:饼图用于一个样本,可以区分类别数据

doughnut chart:环形图用于多个样本,可以区别类别数据

顺序数据:通过计算cumulative percentages向上向下累计,这两者可有不同的解释

线图可以多类方便的放在一张图上,便于比较

对数值型数据要分组处理:

单变量分组:该变量必须是离散值且数量少

组距分组:

  1. 等距分组eg:10-20;20-30;30-40
  2. 异距分组eg:10-70;70-80;80-90;90-140,异距分组容易引起理解偏差,可以用频数密度来表达,避免理解偏差。

得到样本数n,通过以下公式计算得到组数K,根据组数K由{组距=( 最大值 - 最小值)÷ 组数}得到组距,最后绘制直方图,由直方图可看到点连成线之后的数据对称性。

由直方图得到的常见分布如下:

图例:

黄色:众数

红色:中位数

绿色:平均数

直方图Histogram:

1.样本量大用直方图可以反映出分布;

2.样本量小(小于75-100)会出现不稳定的情况

可以采用分不同组数目来看分布是不是一致来判断自己选择组数是否合适

当样本数为无穷大时,直方图上折线图变成PDF(PMF):probability density function概率密度函数,由PDF可推导得到CDF:cumulative distribution function分布函数。

茎叶图Stem-and-leaf plot针对样本量小的未分组数据,它的组距不能人为控制,通常是10或者10的最小公约数。

箱图可用于多类样本比较,如下图:

但是离群点对箱图影响大,可能造成misleading,可以使用公式对所有值进行筛选,选出离群点并去除离群点。

基于其他统计量的箱图:其中可以将四分位点换成任何需要的百分位数,即可以利用箱图来判断置信区间。

垂线图(drop-line)

两个变量之间的问题:

二维散点图(2D Scatterplots)

重叠散点图Overlay Scatter:

散点图矩阵Matrix Scatter

三个变量之间:气泡图bubble chart

bubble chart|Matrix Scatter|Overlay Scatter|Scatterplots|drop-line|box plot|Stem-and-leaf plot|Histogram|Bar chart|Pareto chart|Pie chart|doughnut chart|的更多相关文章

  1. ChartConlrol二维图表类型

    WinForms Controls >Controls > Chart Control > Concepts > Creating Charts > 2D Chart T ...

  2. FusionCharts的使用方法(超详细)

    今天统计价格变化规律的时候找到的一个很好的文档,很详细 一.简介 Ø FusionCharts 是InfoSoft Global 公司的一个产品,InfoSoft Global 公司是专业的Flash ...

  3. FusionCharts的使用方法

    来源于:http://www.cnblogs.com/xuhongfei/archive/2013/04/12/3016882.html 今天统计价格变化规律的时候找到的一个很好的文档,很详细 一.简 ...

  4. 图标插件FusionChartsFree

    二.介绍 Ø FusionCharts 是InfoSoft Global 公司的一个产品,InfoSoft Global 公司是专业的Flash 图形方案提供商,他们还有几款其他的,基于Flash 技 ...

  5. FusionCharts 用法心得

    现在主流的很多jQuery+js结合的图表展示插件,有HighCharts,ECharts等等,今天我们先来了解一下FusionCharts,也是一个非常不错的图表制作工具.希望我的同事以及其他需要帮 ...

  6. FunsionCharts Demo

    原文路径:http://www.cnblogs.com/xuhongfei/archive/2013/04/12/3016882.html 一.简介 Ø FusionCharts 是InfoSoft  ...

  7. [D3] 9. Scatter Plot

    Up until now we've just looked at bar charts. A handy chart, no doubt, but D3 offers a variety of ch ...

  8. Setting up Scatter for Web Applications

    [Setting up Scatter for Web Applications] If you are still using scatter-js please move over to scat ...

  9. Java NIO中的通道Channel(二)分散/聚集 Scatter/Gather

    什么是Scatter/Gather scatter/gather指的在多个缓冲区上实现一个简单的I/O操作,比如从通道中读取数据到多个缓冲区,或从多个缓冲区中写入数据到通道: scatter(分散): ...

随机推荐

  1. 题解 P4171 【[JSOI2010]满汉全席】

    什么,tarjan?那是什么? 码量太大,我选择放弃 为什么不用dfs写2-sat呢?他会伤心的说 这题2-sat的过程大佬们已经讲得非常清楚了,我就略微提一下,主要讲dfs的原理 2_sat原理 我 ...

  2. cJSON api的使用教程

    背景说明:由于和后台通信,为了统一数据格式,选择使用json格式,客户端开发语言使用的是c,故需要借助第三方库来实现json格式的转化,cJSON是一个很好的第三方库, 下载链接1:https://g ...

  3. win10下载软件防止被杀

    很少接触win10,现在需要下载一个软件,但是一直被和谐掉 解决方案: Windows defender 点击病毒和威胁防护 打开定期扫描 找到病毒威胁防护设置 找到排除项 添加排除项 下载成功 但是 ...

  4. TextBox换行C#文本框换行.net文本框换行textarea换行

    在TextBox中输入的内容,显示的时候如果用lable显示,无法换行 可以使用TextBox输入,然后也使用TextBox 显示,这样换行输入的内容,显示的时候也可以换行.显示的时候可以设置一下控件 ...

  5. 14 微服务电商【黑马乐优商城】:day02-springcloud(搭建Eureka注册中心)

    本项目的笔记和资料的Download,请点击这一句话自行获取. day01-springboot(理论篇) :day01-springboot(实践篇) day02-springcloud(理论篇一) ...

  6. Java之多线程方式二(实现Runnable接口)

    /** * 创建多线程的方式二:实现Runnable接口 * 1. 创建一个实现了Runnable接口的类 * 2. 实现类去实现Runnable中的抽象方法:run() * 3. 创建实现类的对象 ...

  7. TPO5-1 Minerals and plants

    Only recently have investigators considered using these plants to clean up soil and waste sites that ...

  8. raw_input|active:|continue|break|

    a = "please" b = "say something:" c =a+b m = 0 a = True while a: m = int(raw_inp ...

  9. 函数动态传参,命名空间,gloabal,nonlocal关键字

    一.函数参数->动态传参(形参的第三种) 动态参数分为两种: 1)动态接收位置参数 普通的位置传参: def func(quality_food,junk_food): print('我要吃', ...

  10. [ZJOI2019]Minimax搜索(线段树+动态DP+树剖)

    为什么我怎么看都只会10pts?再看还是只会50~70?只会O(n2(R-L+1))/O(nlogn(R-L+1))……一眼看动态DP可还是不会做…… 根节点的答案是叶子传上来的,所以对于L=R的数据 ...