SPSSAU数据分析思维培养系列4:数据可视化篇
本文章为SPSSAU数据分析思维培养的第4期文章。
前3期内容分别讲述数据思维,分析方法和分析思路。本文讲述如何快速使用SPSSAU进行高质量作图,以及如何选择使用正确的图形。
本文分别从五个角度进行阐述,首先是SPSSAU自动出图角度,SPSSAU作图思路角度(X和Y的角度),可视化图如何正确使用,以及一部分特殊统计图如何处理和SPSSAU图形样式调整等。
第一部分 SPSSAU分析自动出图
在进行数据分析时,比如频数分析,想了解男女的分布比例,此时直接进行分析SPSSAU默认会生成对应的图,方差分析,T检验,交叉分析等也是如此。
SPSSAU总是会默认提供最适合的图,当然也可选择使用。为什么SPSSAU可以做到这样,原因在于做分析的时候已经带着数据的类型,因此SPSSAU默认就知道应该画出什么样的图形。
比如做交叉分析,在得到规范表格时,SPSSAU默认会生成对应的柱形图,条形图,堆积柱形图或堆积条形图等,SPSSAU默认提供的图通常都是最优的,如果你希望切换成其它类型,点一下就好。
或者在进行方差分析时,需要对比不同类别数据的平均值差异,那么此时使用折线图是最优选择,因此SPSSAU会默认提供折线图,如下:
折线图是对比平均值的最好方式,当然如果需要使用其它图形,比如柱形图,条形图或雷达图等,点击切换即可。如果还有特殊需求,此时也可以把画图的数据直接下载下来,或自己在EXCEL里面作图均可。
SPSSAU可视化结合了数据分析方法的思想,默认提供准确的可视化图形展示,这是SPSSAU智能系统的一个组成部分,如果自己有特征的偏好,想按照自己的想法画图,接下来第二部分讲述如何按照自己的思路进行画图。
第二部分 作图思路X和Y
画图的时候事实上也有一种思维,同前3篇文章里的数据思维,分析思维和分析思路一样。首先区分数据类型,画图通常是体现X和Y之间的关系情况。那么首先需要知道X和Y分别的数据类型是什么,下面总结一个表格说明如下:
按照X和Y的思维,先识别出X和Y分别的数据类型情况,直接使用即可。SPSSAU当前提供累计共30类图形,分布于各个方法中自动生成,当然还有一些复杂或者特殊的图形需要自己作图。
比如多维的柱形图、多维的条形图或者多维的折线图,多维的箱线图,多维的误差线图等。均可在SPSSAU可视化里面找到,如下图:
假如现在想分析不同性别,且不同婚姻状况的人,他们在职业认同上的差异性,希望通过图形可视化展示差异情况;明显的这里面有2个X,而且都是定类数据;职业认同是定量数据,因此可使用‘簇状图’进行,如下图:
第三部分 可视化图的正确使用
前述两部分已经讲述在SPSSAU上如何进行作图,非常简单易懂,本部分讲述如何进行的使用图形,即图形如何进行讲解。首先在选择了正确的图形基础上举例说明,通常情况下,我们都希望图形呈现出有价值的信息,比如数据是否有明显的差异性,也或者数据之间是否有着明显的相关关系,也或者查看数据的分布是否有着正态性等。
依旧以数据类型为例,如果为定类数据,那么数据的选择百分比是否为100%,如果为100%,那么可能使用饼图,或者柱子一样高的堆积柱形(或条形)较为适合,因为需要特别呈现出比例加和为100%的效果;如果说数据为定量,那么通常情况下是查看平均值的大小直接进行对比,折线的高度更高那么说明平均值越大。当然也有可能使用其它的指标,比如中位数等进行表达,但都没有关系,选择了正确的可视化图后直接描述即可,并无复杂可言。
需要特别说明的一点是SPSSAU在可视化里面提供了万能的‘簇状图’,此处SPSSAU进行了智能化处理,无论你放入什么样的数据,SPSSAU总是会帮你生成对应的图形,而不用各个地方到底进行处理。
SPSSAU‘簇状图’里面,不论X的个数为0个,1个,也或者2个,都可以得到对应的图形,一个按钮,智能提供了各类图形的全部生成。并且在得到图形后,也可以手工设置自己希望的指标,比如想统计不同性别群体,他们销售额的平均值,也或者销售总和(求和),也或者销售笔数(计数)等,均可点一下就切换实现图形自动变化。
第四部分 特殊统计图处理
图形可视化在统计里面使用较多,如箱线图可查看数据是否有异常值,或对比数据的差异性;误差线图查看数据的波动幅度及差异情况;PP/QQ图查看数据的正态性情况;帕累托托分析‘二八原则’找到问题原因,也可以使用散点图了解数据之间的关系情况等,在SPSSAU‘可视化’里面均可全部实现,作图效果如下:
第五部分 SPSSAU可视化图样式设置
上述已经讲解SPSSAU的各类可视化图形,接着讲解下SPSSAU可视化图的样式设置等,通常情况下再作图后,比如想切换下样式风格,也或者小数位,也或者不想显示坐标轴等,均可在SPSSAU生成的可视化下面进行设置,如下图:
SPSSAU当前提供字体、字号、小数位、是否隐藏标签、是否展示Y轴,以及四类色彩风格设置,该设置只需要在任何一个地方设置,后续和其它全部的图都会基于该设置生成‘可视化图’,不需要重复进行设置。
更多涉及到图形解读或操作步骤的说明,均可在SPSSAU手册里面找到参考。
SPSSAU数据分析思维培养系列4:数据可视化篇的更多相关文章
- SPSSAU数据分析思维培养系列1:数据思维篇
今天,SPSSAU给大家带来[数据分析思维培养]系列课程.主要针对第一次接触数据分析,完全不懂分析的小白用户,或者懂一些简单方法但苦于没有分析思路,不知道如何规范化分析. 本文章为SPSSAU数据分析 ...
- SPSSAU数据分析思维培养系列3:分析思路篇
本文章为SPSSAU数据分析思维培养的第3期文章. 上文讲解如何选择正确的分析方法,除了有正确的分析方法外,还需要把分析方法进行灵活运用.拿到一份数据,应该如何进行分析,总共有几个步骤,第一步第二步应 ...
- SPSSAU数据分析思维培养系列3:分析思路
本文章为SPSSAU数据分析思维培养的第3期文章. 上文讲解如何选择正确的分析方法,除了有正确的分析方法外,还需要把分析方法进行灵活运用.拿到一份数据,应该如何进行分析,总共有几个步骤,第一步第二步应 ...
- SPSSAU数据分析思维培养系列2:方法选择篇
大家好!在上篇文章中,我们一起学习了如何[掌握正确的数据处理思维].在完成数据准备和清理工作后,就要进入到正式分析阶段,而选择什么样的数据分析方法进行分析是关键. 想要进行科学和系统化的数据分析,分析 ...
- SPSSAU数据分析思维培养系列2:分析方法
大家好!在上篇文章中,我们一起学习了如何掌握正确的数据处理思维(文章链接:https://www.cnblogs.com/spssau/p/12523530.html).在完成数据准备和清理工作后,就 ...
- 小白学 Python 数据分析(15):数据可视化概述
人生苦短,我用 Python 前文传送门: 小白学 Python 数据分析(1):数据分析基础 小白学 Python 数据分析(2):Pandas (一)概述 小白学 Python 数据分析(3):P ...
- ADF_ADF Faces系列6_ADF数据可视化组件简介之建立Thematic Map Component
2013-05-01 Created By BaoXinjian
- ADF_ADF Faces系列4_ADF数据可视化组件简介之建立BarChart/Gauge/ExportExcel
2013-05-01 Created By BaoXinjian
- ADF_ADF Faces系列3_ADF数据可视化组件简介之建立Master-Detail
2013-05-01 Created By BaoXinjian
随机推荐
- Django创建简单数据库
在 创建好的 app 目录下的 models.py 中,编写创建 数据库表的限制条件 class Student(models.Model): s_name = models.CharField(ma ...
- 面试官你好,我已经掌握了MySQL主从配置和读写分离,你看我还有机会吗?
我是风筝,公众号「古时的风筝」,一个简单的程序员鼓励师. 文章会收录在 JavaNewBee 中,更有 Java 后端知识图谱,从小白到大牛要走的路都在里面. 面试官:我看你简历上写的你们公司数据库是 ...
- C/C++编程笔记:C++入门知识丨类和对象
本篇要学习的内容和知识结构概览 类及其实例化 类的定义 将一组对象的共同特征抽象出来, 从而形成类的概念. 类包括数据成员和成员函数, 不能在类的声明中对数据成员进行初始化 声明类 形式为: clas ...
- mysql8的深坑
主要记录下自己的出坑过程,有些其实并不是mysql8的问题,但是由于这个版本产生的阻塞时间最长,所以一并记录: 1-项目代码别人能运行,我本地运行不了 定位后发现是由于本地代码运行数据库连接失败,后来 ...
- Windows环境编译Spark源码
一.下载源码包 1. 下载地址有官网和github: http://spark.apache.org/downloads.html https://github.com/apache/spark Li ...
- Gradient Centralization: 简单的梯度中心化,一行代码加速训练并提升泛化能力 | ECCV 2020 Oral
梯度中心化GC对权值梯度进行零均值化,能够使得网络的训练更加稳定,并且能提高网络的泛化能力,算法思路简单,论文的理论分析十分充分,能够很好地解释GC的作用原理 来源:晓飞的算法工程笔记 公众号 论 ...
- 学生成绩管理系统-JAVA语言测试
首先右键新建一个工程project 选择Java Project,单击next下一步 project命名为“学生成绩管理系统”,点击finish继续 右键src文件夹新建Package包,取名为te ...
- Python面向对象,站在更高的角度来思考
开篇 面向过程编程和面向对象编程是两种基本的编程思想. 很多人学习python,不知道从何学起.很多人学习python,掌握了基本语法过后,不知道在哪里寻找案例上手.很多已经做案例的人,却不知道如何去 ...
- puppet master/agent
puppet master/agent 配置 安装 master: yum install puppet-server agent: yum install puppet 自动签名 puppet的ma ...
- spring时遇到的小问题
最近在学习spring的时候遇到了两个小问题,在此总结一下 1.少导了所需要的包 运行测试程序,报出以下错误. 初步分析,得知是dataSource数据源没有创建成功,以为dataSource配置文件 ...