本文章为SPSSAU数据分析思维培养的第4期文章。

前3期内容分别讲述数据思维分析方法分析思路。本文讲述如何快速使用SPSSAU进行高质量作图,以及如何选择使用正确的图形。

本文分别从五个角度进行阐述,首先是SPSSAU自动出图角度,SPSSAU作图思路角度(X和Y的角度),可视化图如何正确使用,以及一部分特殊统计图如何处理和SPSSAU图形样式调整等。

 

第一部分 SPSSAU分析自动出图

在进行数据分析时,比如频数分析,想了解男女的分布比例,此时直接进行分析SPSSAU默认会生成对应的图,方差分析,T检验,交叉分析等也是如此。

SPSSAU总是会默认提供最适合的图,当然也可选择使用。为什么SPSSAU可以做到这样,原因在于做分析的时候已经带着数据的类型,因此SPSSAU默认就知道应该画出什么样的图形。

比如做交叉分析,在得到规范表格时,SPSSAU默认会生成对应的柱形图,条形图,堆积柱形图或堆积条形图等,SPSSAU默认提供的图通常都是最优的,如果你希望切换成其它类型,点一下就好。

 

或者在进行方差分析时,需要对比不同类别数据的平均值差异,那么此时使用折线图是最优选择,因此SPSSAU会默认提供折线图,如下:

折线图是对比平均值的最好方式,当然如果需要使用其它图形,比如柱形图,条形图或雷达图等,点击切换即可。如果还有特殊需求,此时也可以把画图的数据直接下载下来,或自己在EXCEL里面作图均可。

SPSSAU可视化结合了数据分析方法的思想,默认提供准确的可视化图形展示,这是SPSSAU智能系统的一个组成部分,如果自己有特征的偏好,想按照自己的想法画图,接下来第二部分讲述如何按照自己的思路进行画图。

第二部分 作图思路X和Y

画图的时候事实上也有一种思维,同前3篇文章里的数据思维,分析思维和分析思路一样。首先区分数据类型,画图通常是体现X和Y之间的关系情况。那么首先需要知道X和Y分别的数据类型是什么,下面总结一个表格说明如下:

 

按照X和Y的思维,先识别出X和Y分别的数据类型情况,直接使用即可。SPSSAU当前提供累计共30类图形,分布于各个方法中自动生成,当然还有一些复杂或者特殊的图形需要自己作图。

比如多维的柱形图、多维的条形图或者多维的折线图,多维的箱线图,多维的误差线图等。均可在SPSSAU可视化里面找到,如下图:

 

假如现在想分析不同性别,且不同婚姻状况的人,他们在职业认同上的差异性,希望通过图形可视化展示差异情况;明显的这里面有2个X,而且都是定类数据;职业认同是定量数据,因此可使用‘簇状图’进行,如下图:

 
簇状折线图
 
簇状柱状图
 
箱线图
 
误差线图

第三部分 可视化图的正确使用

前述两部分已经讲述在SPSSAU上如何进行作图,非常简单易懂,本部分讲述如何进行的使用图形,即图形如何进行讲解。首先在选择了正确的图形基础上举例说明,通常情况下,我们都希望图形呈现出有价值的信息,比如数据是否有明显的差异性,也或者数据之间是否有着明显的相关关系,也或者查看数据的分布是否有着正态性等。

依旧以数据类型为例,如果为定类数据,那么数据的选择百分比是否为100%,如果为100%,那么可能使用饼图,或者柱子一样高的堆积柱形(或条形)较为适合,因为需要特别呈现出比例加和为100%的效果;如果说数据为定量,那么通常情况下是查看平均值的大小直接进行对比,折线的高度更高那么说明平均值越大。当然也有可能使用其它的指标,比如中位数等进行表达,但都没有关系,选择了正确的可视化图后直接描述即可,并无复杂可言。

需要特别说明的一点是SPSSAU在可视化里面提供了万能的‘簇状图’,此处SPSSAU进行了智能化处理,无论你放入什么样的数据,SPSSAU总是会帮你生成对应的图形,而不用各个地方到底进行处理。

SPSSAU‘簇状图’里面,不论X的个数为0个,1个,也或者2个,都可以得到对应的图形,一个按钮,智能提供了各类图形的全部生成。并且在得到图形后,也可以手工设置自己希望的指标,比如想统计不同性别群体,他们销售额的平均值,也或者销售总和(求和),也或者销售笔数(计数)等,均可点一下就切换实现图形自动变化。

 
 

第四部分 特殊统计图处理

图形可视化在统计里面使用较多,如箱线图可查看数据是否有异常值,或对比数据的差异性;误差线图查看数据的波动幅度及差异情况;PP/QQ图查看数据的正态性情况;帕累托托分析‘二八原则’找到问题原因,也可以使用散点图了解数据之间的关系情况等,在SPSSAU‘可视化’里面均可全部实现,作图效果如下:

 
 
散点图
 
 
帕累托图
 
 
象限图
散点图

第五部分 SPSSAU可视化图样式设置

上述已经讲解SPSSAU的各类可视化图形,接着讲解下SPSSAU可视化图的样式设置等,通常情况下再作图后,比如想切换下样式风格,也或者小数位,也或者不想显示坐标轴等,均可在SPSSAU生成的可视化下面进行设置,如下图:

 

SPSSAU当前提供字体、字号、小数位、是否隐藏标签、是否展示Y轴,以及四类色彩风格设置,该设置只需要在任何一个地方设置,后续和其它全部的图都会基于该设置生成‘可视化图’,不需要重复进行设置。

 
学术风格
专业风格

更多涉及到图形解读或操作步骤的说明,均可在SPSSAU手册里面找到参考。

SPSSAU数据分析思维培养系列4:数据可视化篇的更多相关文章

  1. SPSSAU数据分析思维培养系列1:数据思维篇

    今天,SPSSAU给大家带来[数据分析思维培养]系列课程.主要针对第一次接触数据分析,完全不懂分析的小白用户,或者懂一些简单方法但苦于没有分析思路,不知道如何规范化分析. 本文章为SPSSAU数据分析 ...

  2. SPSSAU数据分析思维培养系列3:分析思路篇

    本文章为SPSSAU数据分析思维培养的第3期文章. 上文讲解如何选择正确的分析方法,除了有正确的分析方法外,还需要把分析方法进行灵活运用.拿到一份数据,应该如何进行分析,总共有几个步骤,第一步第二步应 ...

  3. SPSSAU数据分析思维培养系列3:分析思路

    本文章为SPSSAU数据分析思维培养的第3期文章. 上文讲解如何选择正确的分析方法,除了有正确的分析方法外,还需要把分析方法进行灵活运用.拿到一份数据,应该如何进行分析,总共有几个步骤,第一步第二步应 ...

  4. SPSSAU数据分析思维培养系列2:方法选择篇

    大家好!在上篇文章中,我们一起学习了如何[掌握正确的数据处理思维].在完成数据准备和清理工作后,就要进入到正式分析阶段,而选择什么样的数据分析方法进行分析是关键. 想要进行科学和系统化的数据分析,分析 ...

  5. SPSSAU数据分析思维培养系列2:分析方法

    大家好!在上篇文章中,我们一起学习了如何掌握正确的数据处理思维(文章链接:https://www.cnblogs.com/spssau/p/12523530.html).在完成数据准备和清理工作后,就 ...

  6. 小白学 Python 数据分析(15):数据可视化概述

    人生苦短,我用 Python 前文传送门: 小白学 Python 数据分析(1):数据分析基础 小白学 Python 数据分析(2):Pandas (一)概述 小白学 Python 数据分析(3):P ...

  7. ADF_ADF Faces系列6_ADF数据可视化组件简介之建立Thematic Map Component

    2013-05-01 Created By BaoXinjian

  8. ADF_ADF Faces系列4_ADF数据可视化组件简介之建立BarChart/Gauge/ExportExcel

    2013-05-01 Created By BaoXinjian

  9. ADF_ADF Faces系列3_ADF数据可视化组件简介之建立Master-Detail

    2013-05-01 Created By BaoXinjian

随机推荐

  1. Django创建简单数据库

    在 创建好的 app 目录下的 models.py 中,编写创建 数据库表的限制条件 class Student(models.Model): s_name = models.CharField(ma ...

  2. 面试官你好,我已经掌握了MySQL主从配置和读写分离,你看我还有机会吗?

    我是风筝,公众号「古时的风筝」,一个简单的程序员鼓励师. 文章会收录在 JavaNewBee 中,更有 Java 后端知识图谱,从小白到大牛要走的路都在里面. 面试官:我看你简历上写的你们公司数据库是 ...

  3. C/C++编程笔记:C++入门知识丨类和对象

    本篇要学习的内容和知识结构概览 类及其实例化 类的定义 将一组对象的共同特征抽象出来, 从而形成类的概念. 类包括数据成员和成员函数, 不能在类的声明中对数据成员进行初始化 声明类 形式为: clas ...

  4. mysql8的深坑

    主要记录下自己的出坑过程,有些其实并不是mysql8的问题,但是由于这个版本产生的阻塞时间最长,所以一并记录: 1-项目代码别人能运行,我本地运行不了 定位后发现是由于本地代码运行数据库连接失败,后来 ...

  5. Windows环境编译Spark源码

    一.下载源码包 1. 下载地址有官网和github: http://spark.apache.org/downloads.html https://github.com/apache/spark Li ...

  6. Gradient Centralization: 简单的梯度中心化,一行代码加速训练并提升泛化能力 | ECCV 2020 Oral

    梯度中心化GC对权值梯度进行零均值化,能够使得网络的训练更加稳定,并且能提高网络的泛化能力,算法思路简单,论文的理论分析十分充分,能够很好地解释GC的作用原理   来源:晓飞的算法工程笔记 公众号 论 ...

  7. 学生成绩管理系统-JAVA语言测试

     首先右键新建一个工程project 选择Java Project,单击next下一步 project命名为“学生成绩管理系统”,点击finish继续 右键src文件夹新建Package包,取名为te ...

  8. Python面向对象,站在更高的角度来思考

    开篇 面向过程编程和面向对象编程是两种基本的编程思想. 很多人学习python,不知道从何学起.很多人学习python,掌握了基本语法过后,不知道在哪里寻找案例上手.很多已经做案例的人,却不知道如何去 ...

  9. puppet master/agent

    puppet master/agent 配置 安装 master: yum install puppet-server agent: yum install puppet 自动签名 puppet的ma ...

  10. spring时遇到的小问题

    最近在学习spring的时候遇到了两个小问题,在此总结一下 1.少导了所需要的包 运行测试程序,报出以下错误. 初步分析,得知是dataSource数据源没有创建成功,以为dataSource配置文件 ...