瞎逼逼:虽然是统计专业,但学艺不精。大学受过的专业训练很少,妥妥学渣。因此工作后决定重新复习,阅读材料为贾俊平的《统计学》第7版。每周更新。
我不按照书里的逻辑顺序和所有知识点来写我的笔记,我写那些与我的工作比较有关的东西(想想之后觉得可以应用到工作中的数据的那些知识点),还会写写我觉得可以怎样应用到工作中,有些不太对的地方请大家多多指教~
第一周的内容是第3章:数据的图表展示。
1 数据审核:检查数据是否有错误。(完整性和准确性(异常值))
2 比例与比率的区别
比例是各部分的数据与全部数据之比;
比率是不同类别数据之间的比值。
3 数据分组
单变量值分组:把每一个值分成一组。适合离散变量,且变量值较少时
组距分组:适合连续变量或变量值较多的情况。
3.1 关于组距分组
步骤:
①确定组数。5-15组。
②确定各组的组距(各组的上限与下限之差)。组距=(最大值-最小值)/组数。
③根据分组编制频数分布表(组+频数+频率)。
分组原则:不重不漏。
①对于连续变量:
1.上组限不在内,a≤X<b.
2.对上一个组的上限值采用小数点的形式。eg.10~11.99,12~13.99
②对于离散变量:相邻两组的组限间断。eg.140~149,150~159
如果全部数据的最大值和最小值与其他数据相差很大,可以使用开口组。
第一组:“xx以下”,最后一组:“XX以上”
不等距分组:比如对于年龄的分组。
实际工作应用:对商品的价格分段分组分析。毛利率、售罄率等

4 向上累积和向下累积 

适用于顺序数据,比如:不满意、一般、满意。

可以做累积分布图。

上面简单说说数据,下面 进入图表内容:

5 总述数据类型与主要图示方法

5.1 品质数据(以下均属汇总表)

条形图、饼图、环形图

5.2  数值型数据

原始数据:茎叶图、箱线图

分组数据:直方图

时间序列数据:线图

多变量数据:散点图(二维)、气泡图(三维)、雷达图(多维)

5.3 关于 直方图

①左右两边的尾巴哪一边偏长,这说明左(右)偏。

②与条形图和柱状图的区别?

首先,横着放的柱状图叫条形图~

然后条形图和直方图的区别:

1. 条形图是用长度表示频数;直方图是用面积表示各组频数(因为还有不等距分组哦,所以是用面积~高度表示每一组的频数,宽度表示每一组的组距);

2.由于分组数据具有连续性,因此直方图的各条柱子是靠一起的,而柱形图是分开的;

3.条形图主要是展示分类数据,直方图展示数值型数据。

5.4 未分组数值型数据的适用图形

茎叶图 :展示数据的原始分布

箱线图:可以展示数据的离散程度(通过箱线图的形状可以看出数据分布的特征),更常用法是用于比较

关于箱线图的一点小摘抄:箱线图不能提供关于数据分布偏态的精确度量,数据集较大时反映的形状信息更加模糊,最好结合均值、标准差、偏度、分布函数等来描述数据集的分布形状。

5.5 雷达图可以对比样本各部分的相似度。

 以上图形在工作中的应用:

条形图、饼图、线图很常用;

箱线图、环形图、直方图、散点图、气泡图、雷达图、帕累托图我还没怎么用过。

那我去研究一下使用公司的数据做出上面的图来吧~然后看能不能发现有趣的东西。

跑路!

下期再见!

1 数据 & 图表的更多相关文章

  1. 数据图表插件Echarts(一)

    一.引言 最近做一个智慧城市项目,项目中需要图表和报表进行数据分析,从网上找了很多,最后找到了百度开放的echarts,一个很强大的插件. 二.介绍 ECharts,缩写来自Enterprise Ch ...

  2. ECharts数据图表系统? 5分钟上手!

    目录: 前言 简介 方法一:模块化单文件引入(推荐) 方法二:标签式单文件引入 [前言] 最近在捣鼓各种插件各种框架,发现这个ECharts还是比较不错的,文档也挺全的,还是中文的,给大家推荐一下. ...

  3. 时隔两个月再写的Echarts(Enterprise Charts,商业级数据图表)一文

    简介 ECharts,缩写来自Enterprise Charts,商业级数据图表,一个纯Javascript的图表库,可以流畅的运行在PC和移动设备上,兼容当前绝大部分浏览器(IE6/7/8/9/10 ...

  4. ECharts – 大数据时代,重新定义数据图表

    ECharts 基于 Canvas 的纯 Javascript 图表库,提供直观,生动,可交互,可个性化定制的数据可视化图表.创新的拖拽重计算.数据视图.值域漫游等特性大大增强了用户体验,赋予了用户对 ...

  5. Python使用plotly绘制数据图表的方法

    转载:http://www.jb51.net/article/118936.htm 本篇文章主要介绍了Python使用plotly绘制数据图表的方法,实例分析了plotly绘制的技巧. 导语:使用 p ...

  6. ajax请求返回Json字符串运用highcharts数据图表展现数据

    [1].[图片] Json字符串和highcharts数据图表展现.jpg 跳至 [1] code=26754#44745" rel="nofollow"> [2] ...

  7. (私人收藏)PPT数据图表

    PPT数据图表 https://pan.baidu.com/s/1lXt8UU20IotD4LLagfTTXAkknf

  8. 通过百度echarts实现数据图表展示功能

    现在我们在工作中,在开发中都会或多或少的用到图表统计数据显示给用户.通过图表可以很直观的,直接的将数据呈现出来.这里我就介绍说一下利用百度开源的echarts图表技术实现的具体功能. 1.对于不太理解 ...

  9. Echart 商业级数据图表

    简介 最近工作上用到这个图表库,图表丰富,用起来也很方便.纯javascript,可以流畅得运行在PC和移动设备上,兼容大部分浏览器. 支持折线图(区域图).柱状图(条状图).散点图(气泡图).K线图 ...

  10. swift app中展示折线图, 饼状图, 柱状图等数据图表

    github 下载Charts-master SDK,该SDK有多种可自定义的图表样式 lineChart 正弦余弦线图 LineChart (cubic lines) LineChart (grad ...

随机推荐

  1. pytest5-使用conftest.py实现多文件共享fixture

    一个测试工程下是可以有多个conftest.py的文件,一般在工程根目录放一个conftest.py起到全局作用.在不同的测试子目录也可以放conftest.py,作用范围只在该层级以及以下目录生效. ...

  2. LeetCode初级算法--设计问题02:最小栈

    LeetCode初级算法--设计问题02:最小栈 搜索微信公众号:'AI-ming3526'或者'计算机视觉这件小事' 获取更多算法.机器学习干货 csdn:https://blog.csdn.net ...

  3. 让搭建在 Github Pages 上的 Hexo 博客可以被 Google 搜索到

    title: 让搭建在Github Pages上的Hexo博客可以被Google搜索到 date: 2019-05-30 23:35:44 tags: 配置 --- 准备工作 搭建好的博客 npm & ...

  4. 生成对抗网络(Generative Adversarial Networks,GAN)初探

    1. 从纳什均衡(Nash equilibrium)说起 我们先来看看纳什均衡的经济学定义: 所谓纳什均衡,指的是参与人的这样一种策略组合,在该策略组合上,任何参与人单独改变策略都不会得到好处.换句话 ...

  5. 设计模式(一)Iterator模式

    Iterator模式用于在数据集合中按照顺序遍历集合.即迭代器模式. 下面来看一段实现了迭代器模式的示例程序. 这段程序的作用是将书(Book)放置到书架(BookShelf)中,并将书的名字按顺序显 ...

  6. 大觅网05Day

    1.Mycat概述 在此前的服务器对数据库的存储数量要求并不高的时候,被经常使用的MySql数据基本能够满足对数据存储的要求. 但随着技术的不断发展,MySql甚至Redis都无法满足现今存储数量的指 ...

  7. Python中xml和dict格式转换

    在做接口自动化的时候,请求数据之前都是JSON格式的,Python有自带的包来解决.最近在做APP的接口,遇到XML格式的请求数据,费了很大劲来解决,解决方式是:接口文档拿到的是XML,在线转化为js ...

  8. 关于css里大于号(>)的用法

    之前用的css没涉及到这个问题,今天看到.知道大概用法,但不知道和普通的后代选择器有什么区别.到网上找了,其实w3c的css文档里有很详细明确的介绍(http://www.w3school.com.c ...

  9. IDEA 使用lombok

    一.配置maven <dependency> <groupId>ch.qos.logback</groupId> <artifactId>logback ...

  10. [考试反思]1001csp-s模拟测试(b):逃离

    如你所见,b组题,除了NC乱入直奔T2抢了我一个首杀以外A层学过FFT的人都没有参加. 竞争压力很小,题又简单,所以就造就了6个AK. 然而并不计入总分,我仍然稳在第二机房. T1lyl16分钟切掉我 ...