一提到数学,高等数学,线性代数,概率论与数理统计,数值分析,空间解析几何这些数学课程,头疼呀。作为文科生,遇见这些课程时,通常都是各种寻求帮助,班上有位宅男数学很厉害,各种被女生‘围观’,这数学为什么这么难,学了有啥用呀。

有用的,当做数据分析的时候,使用到SPSS,在线SPSS分析的时候就知道用处了,在写论文的时候会用到SPSS数据分析,工作的时候也会用到SPSS数据分析。此时才知道原来数学很重要。我的数学不好肿么办?听我一 一道来。

1. 数据类型

学过数学的童鞋都知道,数学里面分了两类数据,离散和连续数据,听上去文绉绉的,不懂。那我问男人和女人知道不,知道,对了这种就是离散数据。身高体重知道不,知道,这种就是连续数据。离散数据可以理解为分类,类别,数个数;而连续数据理解为算平均值,度量,比如平均身高,平均年龄,但不能说成是平均性别。离散和连续数据是数学上文绉绉的称呼。如果我们是做数据分析,通常又换成另外一种称呼,定类和定量数据。定类就是离散数据,定量就是连续数据。这点get到后,数据分析方法啥都不在话下,让智能化软件SPSSAU【备注:在线网页版SPSS】这些去解决就好,默认出来智能化文字分析结果。

2. X和Y

除了数据类型外,数学上老是有一些符号,比如X,Y,Z, α, β,γ,还有好多拉丁符号,看着都头疼,而且更糟糕的是发音还那么奇怪。这些都是数学用词,如果是数据分析,只需要知道X和Y就可以。为什么这么简单呢?数据分析通常是用于业务场景,让所有人都会所有人都能懂的。而数学符号是专业性名词,一小部分学习数学专业的人群才懂。

而X,Y基本所有人都懂,平面二维式思维,如果加上Y就变成空间三维思维。这种会变得复杂难懂,而数据分析出来结果是让人理解让人懂的,越简单易懂越有意义越有用的结论越受欢迎。因此从数据分析角度来看,只需要懂X,Y这两个符号就OK。别小看X,Y这两个符号,加上上述的数据类型,它们可以产生非常多的组合,也称作分析方法。

有了X,Y,我们可以研究X和Y之间的关系情况,比如X对于Y的影响关系,X对于Y的差异关系等。下面一一讲述。

3. X和Y的组合方法

再讲组合之前,先单独讲下不区分X和Y的分析方法,如下表格:

 

当不需要区分不区分X和Y时,比如我只研究性别1个数据,或者只研究身高,体重情况如何等。并不需要研究关联关系,所以并不涉及X和Y的关联关系。这种都可统称为数据基本描述统计,当然数据类型不一样时,方法不同。比如性别为定类数据,这时用频数分析;身高体重是定量数据,这时用描述分析。数据的基本描述统计是最基础的数据分析方法,而且通常都需要做这类分析方法,因为了解了基本情况是非常必要的。

接下来将下X和Y之间的关联关系时,会使用到的数据研究方法;如下表格:

 

从上表可以看到,通常会涉及到差异关系,相关关系和影响关系共三类。比如不同性别的兴趣爱好是否有差异,性别为定类数据,兴趣爱好也是定类数据;此时就应该使用交叉卡方分析方法。比如研究性别人群体重是否有差异,性别为定类数据,体重为定量数据,此时就需要使用T检验;除此之外,如果想研究不同专业(理科、工科、文科)的体重差异时,此时应该使用方差分析。当X是定类数据,Y是定量数据,研究X对于Y的差异时,可以使用T检验和方差分析;区分在哪里呢?如果X的类别个数(比如男和女)只有2个时,通常使用T检验;如果X的类别个数超过2个(比如理科、工科和文科)时,只能使用方差分析。差异关系就只能有3种,接下来继续相关关系。

相关关系是研究X和Y的关系情况,比如身高和体重之间有没有关系;X和Y均是定量数据;此时应该使用相关关系,再具体一点应该叫Pearson相关关系(相关关系的数学公式是Pearson这人发明的)。

最后一类是影响关系;X对于Y的影响;影响关系的分析方法区分,完全是根据Y的类别而定;比如Y是定量数据,我们则应该使用线性回归分析;如果Y为定类数据,此时我们应该使用Logit回归分析,而具体再细分,Logit回归可以有:二元Logit回归,多分类Logit回归,区分在于Y,举例如下表:

 

如果X影响Y时,Y只分为两类,购买和不购买,愿意和不愿意,是和否等,这时候就需要使用二元Logit回归分析;如果Y分为n类(n>2)时,则需要使用多分类Logit回归。

数据类型,X和Y;这两点搞明白后,绝大多数的数据研究方法都可以搞定,而这也是当前数学研究的核心思想。也是分析软件的设计理念,网页在线版本的SPSS即SPSSAU软件平台,它的设计核心理念就是这样,只需要会区分数据类型,知道X和Y;就可以自己进行数据分析,其它的全部都可以直接由SPSSAU生成智能化文字结果;当然,分析方法还有很多的,比如因子分析,聚类分析等,这些方法不是研究X和Y的关联性,而是别有用处。

4. 其它研究方法

除开X与Y的关联关系研究,其实还有一些其它的研究方法;比如对于很多个X同时进行分析应该使用什么方法呢?此时可能会结合分析用处而对应不同的方法;常见有因子分析和聚类分析两种,如下表:

 

如果说了30句话,现在想把30句话概括浓缩成5个关键词,这种就叫浓缩;此时需要使用因子分析;如果有300个人想进行分类,分成3类人群,此时可使用聚类分析(常见是K-means聚类方法)。

除了浓缩和聚类,事实还有非常多其它的研究方法,比如信度研究,多因素方差,非参数检验,正态性检验,配对T检验等等。后续慢慢再谈,更多知识也可使用网页版SPSS即SPSSAU【备注:在线网页版SPSS】进行学习,里面智能化分析结果一目了然,‘拖拽点一下’完成分析得到智能化结果,更多研究方法的详述也可直接查到。

SPSS数据分析方法不知道如何选择的更多相关文章

  1. SPSS数据分析—多维尺度分析

    在市场研究中,有一种分析是研究消费者态度或偏好,收集的数据是某些对象的评分数据,这些评分数据可以看做是对象间相似性或差异性的表现,也就是一种距离,距离近的差异性小,距离远的差异性大.而我们的分析目的也 ...

  2. 快速掌握SPSS数据分析

      SPSS难吗?无非就是数据类型的区别后,就能理解应该用什么样的分析方法,对应着分析方法无非是找一些参考资料进行即可.甚至在线网页SPSS软件直接可以将数据分析结果指标人工智能地分析出来,这有多难呢 ...

  3. 八大排序方法汇总(选择排序,插入排序-简单插入排序、shell排序,交换排序-冒泡排序、快速排序、堆排序,归并排序,计数排序)

    2013-08-22 14:55:33 八大排序方法汇总(选择排序-简单选择排序.堆排序,插入排序-简单插入排序.shell排序,交换排序-冒泡排序.快速排序,归并排序,计数排序). 插入排序还可以和 ...

  4. SPSS数据分析—生存分析

    生存分析是对生存时间进行统计分析的一种技术,所谓生存时间,就是指从某一时间点起到所关心的事件发生的这段时间.这里的时间不一定就是钟表日历上的时间,也有可能是其他的度量单位,比如长度单位等. 生存时间有 ...

  5. SPSS数据分析-时间序列模型

    我们在分析数据时,经常会碰到一种数据,它是由时间累积起来的,并按照时间顺序排列的一系列观测值,我们称为时间序列,它有点类似于重复测量数据,但是区别在于重复测量数据的时间点不会很多,而时间序列的时间点非 ...

  6. SPSS数据分析—加权最小二乘法

    标准的线性回归模型的假设之一是因变量方差齐性,即因变量或残差的方差不随自身预测值或其他自变量的值变化而变化.但是有时候,这种情况会被违反,称为异方差性,比如因变量为储蓄额,自变量为家庭收入,显然高收入 ...

  7. SPSS数据分析—卡方检验

    t检验和方差分析主要针对于连续变量,秩和检验主要针对有序分类变量,而卡方检验主要针对无序分类变量(也可以用于连续变量,但需要做离散化处理),用途同样非常广泛,基于卡方统计量也衍生出来很多统计方法. 卡 ...

  8. SPSS数据分析—非参数检验

    统计学的假设检验可以分为参数检验和非参数检验,参数检验都是根据一些假设条件推算而来,当这些假设条件无法满足的时候,参数检验的效能会大打折扣,甚至出现错误的结果,而非参数检验通常是没有假设条件的,因此应 ...

  9. SPSS数据分析—对数线性模型

    我们之前讲Logistic回归模型的时候说过,分类数据在使用卡方检验的时候,当分类过多或者每个类别的水平数过多时,单元格会划分的非常细,有可能会导致大量单元格频数很小甚至为0,并且卡方检验虽然可以分析 ...

随机推荐

  1. JS-对象中写方法

  2. EF Core的Code First 基础

    一.创建实体类与映射类 通过NuGet引用Microsoft.EntityFrameworkCore 1.创建实体类 Code First可以通过为实体类字段添加相应特性,来创建对应的字段类型等,举例 ...

  3. memcached.c 源码分析

    上文分析了memcached的autoconf过程以及configure, make过程,可以看到,memcached可执行文件是由memcached-memcached.o以及其他文件连接后编译出来 ...

  4. 第十五章 LVM管理和ssm存储管理器使用 随堂笔记

    第十五章 LVM管理和ssm存储管理器使用 本节所讲内容: 15.1 LVM的工作原理 15.2 创建LVM的基本步骤 15.3 实战-使用SSM工具为公司的邮件服务器创建可动态扩容的存储池 LVM的 ...

  5. Java泛型使用的简单介绍

    目录 一. 泛型是什么 二. 使用泛型有什么好处 三. 泛型类 四. 泛型接口 五. 泛型方法 六. 限定类型变量 七. 泛型通配符 7.1 上界通配符 7.2 下界通配符 7.3 无限定通配符 八. ...

  6. 2019牛客多校训练第三场H.Magic Line(思维)

    题目传送门 大致题意: 输入测试用例个数T,输入点的个数n(n为偶数),再分别输入n个不同的点的坐标,要求输出四个整数x1,y1,x2,y2,表示有一条经过点(x1,y1),(x2,y2)的直线将该二 ...

  7. [转载]ActiveMQ实现负载均衡+高可用部署方案

    转载于 http://www.open-open.com/lib/view/open1400126457817.html 一.架构和技术介绍 1.简介 ActiveMQ 是Apache出品,最流行的, ...

  8. Java虚拟机——Java内存区域

    1.运行时区域 Java虚拟机在执行Java程序的时候会把它管理的内厝划分为若干个不同功能的数据区域,如图所示 首先是程序计数器,程序计数器可以理解为当前程序执行的字节码的行号指示器,计数器中的数据即 ...

  9. Sentry错误日志监控你会用了吗?

    无论作为新手还是老手程序员在程序的开发过程中,代码运行时难免会抛出异常,而且项目在部署到测试.生产环境后,我们便不可能像在开发时那样容易的及时发现处理错误了.一般我们都是在错误发生一段时间后,错误信息 ...

  10. Oracle 主键、联合主键的查询与创建

    --查询某个表是否有唯一主键 select cu.* from user_cons_columns cu, user_constraints au where cu.constraint_name = ...