本文章为SPSSAU数据分析思维培养的第3期文章。

上文讲解如何选择正确的分析方法,除了有正确的分析方法外,还需要把分析方法进行灵活运用。拿到一份数据,应该如何进行分析,总共有几个步骤,第一步第二步应该做什么,需要有个宏观把控,只有这样才能有规范的研究科学的思维和逻辑。

 

本文章首先阐述数据的整体思维,即整体把控住应该如何剖析一份数据做到心理有数,接着针对常见的问卷进行思维剖析,并且提供思路框架,期许为大家带来一丝丝帮助。

第一部分 把控数据思维

如果想要把控好数据思维,简单来讲在拿到一份数据后如何进行分析,心里应该有个底。做到以下几点,相信可以更好地理解数据思维。首先是针对数据特征描述,其次是对数据质量说明,研究目的是什么如何使用研究方法或措施去匹配论证研究目的,最后把数据结果呈现出来并且进行讨论说明。

1、数据特征描述

拿到一份数据时,首先看下数据的特征,比如性别的分布情况如何,平均年龄情况如何。当然这里是需要区分定类和定量数据分别进行描述,比如性别是定类数据使用百分比频数说明,年龄是定量数据使用平均值或中位数进行描述说明,在‘数据分析思维培训之2’里面有详细说明。

为什么首先需要对数据特征进行描述呢?简单来讲,每份数据都有自己的background,研究是基本数据进行,首先需要告诉下别人我研究的数据是一群什么样的人或者物体。在此基础上才能进行后续的进一步分析。

如果研究群体出问题自然后续结论也会有问题,比如研究00后群体,但数据是基本80后,不同群体对于同一事情很可能有着不同的观点和态度。而且在最后进行说明讨论的时候也是基本样本群体的特征而进行,因此在数据分析时,通常首先需要描述清楚研究群体到底是什么样的。

2、数据质量说明

接着,一般需要对数据的质量进行说明,此步骤可以使用研究方法,比如信度分析、组内相关系数ICC等等进行说明,但有时候数据不适合分析方法要求因而不能使用分析方法进行研究。此时正确的做法是详细描述清楚数据的来源,比如实验数据的背景情况下是什么,基于什么样的实验条件因素进行等,充分证明数据的质量可靠即可。形式不限,文字描述或者使用研究方法等均可。

SPSSAU分析途径
 

3、研究目的剖析

对于数据基本特征和数据质量剖析后,接下来最关键的步骤是结合自己的研究目的进行。一般来说研究目的可分为两大类,一是差异关系研究;二是影响关系研究,以及其它。

比如不同性别群体是否吸烟的差异性,不同性别群体对于奢侈品的购买意愿或购买行为差异性。差异关系是一种常见且通用的研究方法,一般涉及到比如卡方分析、方差分析、T检验等,结合自己的数据类型进行选择使用即可。

而对于影响关系而言,更多出现于学术研究中,通过影响关系研究去论证观点的正确性,影响关系通常可使用比如线性回归、logistic回归、岭回归、Robust回归等。具体不同的研究方法可能对应着不同的数据类型,但都不复杂,关键的地方在于符合研究的目的。

有时候为了研究目的服务,可能还会对数据进行‘中间过程处理’,比如对于数据的信息浓缩,可使用因子分析等;或者对于样本群体的聚类,可首先进行聚类分析,然后聚类出不同类别群体再做后续的分析使用。研究目的通常是在准备数据之前就已经确定,因为先有思路再有数据的准备,最后才是进行分析。

4、数据结果呈现

在进行数据研究时,很可能需要对于数据结果进行呈现,通常是两种方式分别是表格和图。表格是通用的方式,但其比较‘枯燥’。因而很多时候需要结合数据情况进行可视化即图形展示。一般针对定类数据的图形较多,比如饼图、条形图、柱形图,帕累托图,词云图等;而涉及到定量数据,由于其通过平均值进行表达描述,因而更多可能会使用比如折线图,簇状图等,当然如果是纯统计角度上,还可能的比如箱线图,散点图,直方图,PPQQ图等,均可在SPSSAU中快速的找到;分析与数据呈现是连在一起的,有了数据研究结论一定需要用某种形式呈现出来,无非是选择图或表,也或者二者均用;核心在于可以直观快速的呈现出结果。

 
SPSSAU分析途径

数据分析思路事实上还有很多,比如模型的灵活运用,模型的选择使用等,同样的数据和研究目的,很可能使用到不同的研究模型,比如研究影响关系,都是定量数据。很可能会使用到线性回归、路径分析等,此时可结合实际情况,以及自身的理解综合评估即可,并无绝对对应关系。

第二部分 问卷量表思维参考

问卷数据是常见的一种数据来源,而且问卷中很多时候会使用到量表数据,针对此种量表数据,SPSSAU提供一种分析思路参考如下图:

其实从上表可知,第1和第2点均是对于数据特征进行描述。接着第4和第5点属于数据质量研究。第3点是为第6,7,8,9这4点服务。第6点是核心研究数据的特征描述。第7和第8点相关和假设分析属于影响关系的分析范畴。最后第9点是差异关系的范畴。

没有绝对的研究步骤,但从上图可以看到,基本上是先数据特征描述,接着数据质量分析,再接着核心研究数据的特征描述,进一步影响关系研究,最后差异关系研究。至于细节性问题,比如信度和效度分析谁先谁后,一般而言是信度在前效度在后。影响关系和差异关系谁先谁后呢?看研究目的,越重要的越放前,相对不重要的靠后即可。

第三部分 问卷非量表思维参考

针对非量表类问卷,非量表类问卷最大的特点是:非常多的单选题,多选题等,通常此类问卷用于政策现状研究、基本态度情况研究等。如果此类问卷,多数是使用频数分析,以及涉及多选题的几类方法;同时还有交叉卡方分析。

 

思路上第1和第2点属于数据特征描述,先搞清楚研究数据的基本背景特征情况。接着对于核心研究项进行特征描述,即第3和第4点。除此之外还可以进行差异关系研究,即第5点,一般使用卡方分析。第6点影响关系研究一般会使用到logistic回归分析等。分析思路上紧密相联,先数据特征描述,核心变量特征描述,差异关系,影响关系研究,并且在最后进行汇总。

第四部分 其它

在数据分析思路上,还会有很多种类型,本文并没有提供到权重研究,事实上很多研究目的在于计算权重体系,当然此种情况目的非常清晰,主要奔着研究目的去就好,正常情况下都会使用到SPSSAU综合评价里面的研究方法。

SPSSAU分析途径

除了权重体系的构建,还有聚类数据,把数据样本群体分成几个类别等分析思路,先把思路确认好,接着大致就可以对应上正确的数据分析方法,准备好数据直接分析就可以。

更多涉及到数据思路上的资料可在SPSSAU手册里面找到参考,包括影响关系类研究,现状政策类研究,调节/中介类研究,实验类差异研究和聚类样本类研究共五类思路等。

更多干货内容可登录SPSSAU官网查看。

SPSSAU数据分析思维培养系列3:分析思路篇的更多相关文章

  1. SPSSAU数据分析思维培养系列3:分析思路

    本文章为SPSSAU数据分析思维培养的第3期文章. 上文讲解如何选择正确的分析方法,除了有正确的分析方法外,还需要把分析方法进行灵活运用.拿到一份数据,应该如何进行分析,总共有几个步骤,第一步第二步应 ...

  2. SPSSAU数据分析思维培养系列2:分析方法

    大家好!在上篇文章中,我们一起学习了如何掌握正确的数据处理思维(文章链接:https://www.cnblogs.com/spssau/p/12523530.html).在完成数据准备和清理工作后,就 ...

  3. SPSSAU数据分析思维培养系列1:数据思维篇

    今天,SPSSAU给大家带来[数据分析思维培养]系列课程.主要针对第一次接触数据分析,完全不懂分析的小白用户,或者懂一些简单方法但苦于没有分析思路,不知道如何规范化分析. 本文章为SPSSAU数据分析 ...

  4. SPSSAU数据分析思维培养系列4:数据可视化篇

    本文章为SPSSAU数据分析思维培养的第4期文章. 前3期内容分别讲述数据思维,分析方法和分析思路.本文讲述如何快速使用SPSSAU进行高质量作图,以及如何选择使用正确的图形. 本文分别从五个角度进行 ...

  5. SPSSAU数据分析思维培养系列2:方法选择篇

    大家好!在上篇文章中,我们一起学习了如何[掌握正确的数据处理思维].在完成数据准备和清理工作后,就要进入到正式分析阶段,而选择什么样的数据分析方法进行分析是关键. 想要进行科学和系统化的数据分析,分析 ...

  6. 实用教程!SPSSAU验证性因子分析思路总结

    验证性因子分析,是用于测量因子与测量项(量表题项)之间的对应关系是否与研究者预测保持一致的一种研究方法.尽管因子分析适合任何学科使用,但以社会科学居多. 目前有很多软件都可以非常便利地实现验证性因子分 ...

  7. enode框架step by step之框架要实现的目标的分析思路剖析1

    enode框架step by step之框架要实现的目标的分析思路剖析1 enode框架系列step by step文章系列索引: 分享一个基于DDD以及事件驱动架构(EDA)的应用开发框架enode ...

  8. 有效的结构化思维训练,MECE分析法

    MECE原则,表达精准分类与全面性的有效利器 结构化思维的本质就是逻辑,其目的在于对问题的思考更完整.更有条理,它帮助我们一个一个找到线头,理清思路,探求事物之间的相互联系.MECE分析法是一种结构化 ...

  9. 小白数据分析——Python职位全链路分析

    最近在做Python职位分析的项目,做这件事的背景是因为接触Python这么久,还没有对Python职位有一个全貌的了解.所以想通过本次分析了解Python相关的职位有哪些.在不同城市的需求量有何差异 ...

随机推荐

  1. Arch Linux卡在 sddm 登录界面

    问题描述: 刚装完Arch Linux 之后发现能正常打开登录界面,但点击登录之后闪屏了一下又回到登录界面 可能的原因: /home 目录没挂载磁盘 user的权限没有设置好 解决办法: 对于第一种 ...

  2. Python简单的语句组

    Python简单的语句组: ''' if 条件1: 条件1满足时,需要运行的内容 ''' num = 10 if num % 6 == 4: print("num 对 6 的取模结果是 4& ...

  3. Vue无限滚动加载数据

    Web项目经常会用到下拉滚动加载数据的功能,今天就来种草Vue-infinite-loading 这个插件,讲解一下使用方法! 第一步:安装 npm install vue-infinite-load ...

  4. 排序HEOI2016/TJOI2016 二分+线段树判定

    LINK:排序 此题甚好我一点思路都没有要是我当时省选此题除了模拟我恐怕想不到还可以二分 还可以线段树... 有点ex 不太好写 考虑 暴力显然每次给出询问我们都是可以直接sort的 无视地形无视一切 ...

  5. 焦点损失函数 Focal Loss 与 GHM

    文章来自公众号[机器学习炼丹术] 1 focal loss的概述 焦点损失函数 Focal Loss(2017年何凯明大佬的论文)被提出用于密集物体检测任务. 当然,在目标检测中,可能待检测物体有10 ...

  6. sqlzoo刷题 SELECT from Nobel Tutorial

    SELECT from Nobel Tutorial 1.Change the query shown so that it displays Nobel prizes for 1950. SELEC ...

  7. 实验04——java保留小数的两种方法、字符串转数值

    package cn.tedu.demo; import java.text.DecimalFormat; /** * @author 赵瑞鑫 E-mail:1922250303@qq.com * @ ...

  8. Android Studio同时监听多个Button实现activity跳转

    MainActivity.java: package com.example.test; import android.content.Intent; import android.os.Bundle ...

  9. 微信小程序--家庭记账小账本(五)

    (源码已上传至github,https://github.com/xhj1074376195/CostBook_weixin) 今天,尝试弄了账单的表,发现还是弄不了,于是就把账单上的删除功能给去了, ...

  10. puppet master/agent

    puppet master/agent 配置 安装 master: yum install puppet-server agent: yum install puppet 自动签名 puppet的ma ...