之前介绍过的基于线性模型的方差分析,虽然扩展了方差分析的领域,但是并没有突破方差分析三个原有的假设条件,即正态性、方差齐性和独立性,这其中独立性要求较严格,我们知道方差分析的基本思想其实就是细分,将所有对因变量产生影响的因素逐一摘出,但是如果各观测值之间相互影响,这样在细分影响因素的时候,是很难分出到底是自变量的影响还是观测值之间自己的影响。虽然随机抽样会最大程度的使数据满足独立性,但是有时候这种方法并不奏效,比如随机抽取受访者分析其消费特征,这里就假定所有受访者的之间是相互独立的,然而仔细想想,这其中存在问题,如果某些受访者来自同一个城市或地区,从个体角度讲,他们确实是独立的人,之间没有任何联系,但是如果从分析目的角度讲,由于区域因素他们之间的消费特征是趋于相似的,而产生这种相似性,正是由于相互作用导致,这些人是存在相互影响关系的,也就类以于相关样本,与此同时,这种相互作用也使得不同城市间的消费特征产生差异,我们称这种数据为具有层次聚集性的数据。数据的聚集性除了表现在聚集因素间指标的均值水平不同外,还表现在不同城市间的指标离散度上。

从层次聚集性数据也可以看出,随机抽样只能保证数据被抽到的概率相同,但是对于抽到的是什么样的数据,却无法控制了。对于这种具有层次结构的数据,如果分析目的仅限于这几种层次,比如就分析这几个城市,那么可以把它当做一种固定因子,只分析固定效应而不用考虑这种聚集性,但是如果想把结果推广到所有城市,那就不能忽略这种特征,否则会降低结果的准确性,因此还要加入随机效应。

混合线性模型就是同时包含固定效应和随机效应的线性模型,是解决此类层次聚集性数据的方法之一,对于具有层次结构的数据,我们需要将使观测值之间产生相互影响的层次因素也摘出来,比如上述中的城市因素,传统的方差分析模型中,将所有无法解释的因素都归在随机误差中,而随着我们对传统方差模型的不断拓展,对随机误差的分解也越来越精细,结果也越来越准确。

【例】我们想分析哪些因素会对16岁时毕业成绩的影响,显然毕业成绩和学校有关,好学校的学生成绩会好一些,而差学校的学生成绩会差一些,那么学校这个因素就是上述的层次因素,它使得因变量产生相关性,而且我们是想把结果推广到所有学校,因此学校这个变量应该被定为随机变量,我们首先按照一般线性模型来分析,不考虑层次因素

分析—一般线性模型—单变量


在按照一般线性模型分析之后,我们再来看看按照混合线性模型分析的结果会有什么不同

分析—混合模型—线性





经过以上分析,我们知道学校确实是一个层次聚集因素,不能按照一般线性模型进行分析,那么影响16岁考试成绩的原因有很多,我们继续加入变量进行分析。
首先加入11岁时的入学成绩,先将其加入固定因素,并观测和之前不加人任何因子相比有何变化



通过以上分析,我们看到,在固定因素中加入入学成绩这个变量以后,对于层次聚集性起到了减弱的效果,但是该影响仍然存在,说明还需要引入其他变量以完善模型,之前讲过,数据聚集性除了表现在聚集因素间指标的均值水平不同外,还表现在不同聚集因素间的指标离散度上,我们现在将11岁时的入学成绩这个变量加入随机因素中。

在将11岁毕业成绩引入到随机效应之后,层次聚集性又进一步减弱了,实际上我们可以不断的引入变量,这样最终层次聚集性就会消失,下面我们再来引入性别、学校类型、各学校学生在11岁入学时的平均成这三个变量。



根据以上思路,我们可以继续将变量引入随机效应、或者分析变量间的交互作用等,对数据进行更进一步的分析。

SPSS数据分析—混合线性模型的更多相关文章

  1. SPSS数据分析—广义线性模型

    我们前面介绍的一般线性模型.Logistic回归模型.对数线性模型.Poisson回归模型等,实际上均属于广义线性模型的范畴,广义 线性模型包含的范围非常广泛,原因在于其对于因变量.因变量的概率分布等 ...

  2. SPSS数据分析—对数线性模型

    我们之前讲Logistic回归模型的时候说过,分类数据在使用卡方检验的时候,当分类过多或者每个类别的水平数过多时,单元格会划分的非常细,有可能会导致大量单元格频数很小甚至为0,并且卡方检验虽然可以分析 ...

  3. 混合线性模型(linear mixed models)

    一般线性模型.混合线性模型.广义线性模型 广义线性模型GLM很简单,举个例子,药物的疗效和服用药物的剂量有关.这个相关性可能是多种多样的,可能是简单线性关系(发烧时吃一片药退烧0.1度,两片药退烧0. ...

  4. SPSS数据分析方法不知道如何选择

      一提到数学,高等数学,线性代数,概率论与数理统计,数值分析,空间解析几何这些数学课程,头疼呀.作为文科生,遇见这些课程时,通常都是各种寻求帮助,班上有位宅男数学很厉害,各种被女生‘围观’,这数学为 ...

  5. 快速掌握SPSS数据分析

      SPSS难吗?无非就是数据类型的区别后,就能理解应该用什么样的分析方法,对应着分析方法无非是找一些参考资料进行即可.甚至在线网页SPSS软件直接可以将数据分析结果指标人工智能地分析出来,这有多难呢 ...

  6. SPSS数据分析—广义线性混合模型

    广义线性混合模型是目前线性模型范畴内最为完备的模型框架,它是广义线性模型的进一步延伸,进一步突破适用条件,因变量既 可以非正态,也可以非独立,由于其最为复杂,因此SPSS对其输出结果采用模型格式,而不 ...

  7. SPSS数据分析—二分类Logistic回归模型

    对于分类变量,我们知道通常使用卡方检验,但卡方检验仅能分析因素的作用,无法继续分析其作用大小和方向,并且当因素水平过多时,单元格被划分的越来越细,频数有可能为0,导致结果不准确,最重要的是卡方检验不能 ...

  8. SPSS数据分析—生存分析

    生存分析是对生存时间进行统计分析的一种技术,所谓生存时间,就是指从某一时间点起到所关心的事件发生的这段时间.这里的时间不一定就是钟表日历上的时间,也有可能是其他的度量单位,比如长度单位等. 生存时间有 ...

  9. SPSS数据分析—多维尺度分析

    在市场研究中,有一种分析是研究消费者态度或偏好,收集的数据是某些对象的评分数据,这些评分数据可以看做是对象间相似性或差异性的表现,也就是一种距离,距离近的差异性小,距离远的差异性大.而我们的分析目的也 ...

随机推荐

  1. Fiddler- -Composer创建和发送HTTP Request

    Fiddler的功能还有很多, 很多功能都没有被挖掘出来.这次我们介绍Fiddler中的一个非常有用的功能Composer,是用来创建和发送HTTP Request的.Composer的使用方法很简单 ...

  2. 【转】PHP 位运算应用口诀

    位运算应用口诀 清零取位要用与,某位置一可用或 若要取反和交换,轻轻松松用异或 移位运算 要点 1 它们都是双目运算符,两个运算分量都是整形,结果也是整形. 2 "<<" ...

  3. matlab中动态绘图并保存为视频的小例子

    如题,多的就不说了,先上一个效果: 每隔0.1秒,绿色的直线转动一个角度. 再看看代码如何实现: fuction main clear; clc; %%%%%%%%%%%%%%%%%%%%%%%%%% ...

  4. function 类型

    一.函数的声明方式 1.普通的函数声明 function box(num1,num2){ return num1+num2; }alert(box(1,2)); 2.使用变量初始化函数 var box ...

  5. 商人过河问题(DFS)

    问题描述:3个商人带着3个仆人过河,过河的工具只有一艘小船,只能同时载两个人过河,包括划船的人.在河的任何一边,只要仆人的数量超过商人的数量,仆人就会联合起来将商人杀死并抢夺其财物,问商人应如何设计过 ...

  6. BJFU 1015

    描述 数字具有神奇的魔力,神奇到ben想把所有数字全部保存起来.于是他设想了如下的保存方法.假设有一张无限大的纸板,将所有自然数(不包括0)按如下顺序排列书写在纸板上保存:1 2 6 7  15  1 ...

  7. C#学校班级自动升级实现代码

    代码逻辑如下: //班级自动升级 //获取该学校还没有毕业的班级 List<ClassInfoes> classinfoeslist = classinfoesbll.GetList(Sc ...

  8. java 8增强的包装类

    ---恢复内容开始--- 1java为8个类型提供了对应的包装类.因为这8个类型并不是类或者对象,他们原本是不应该存在在java里的(这里说的只是原本),这里要强调的是,java允许把基本类型的值直接 ...

  9. 15. 星际争霸之php设计模式--策略模式

    题记==============================================================================本php设计模式专辑来源于博客(jymo ...

  10. 在linux中的info手册的用法

    就是一些快捷键 空格键向下翻页,当处在当前节点的底部时,空格键跳转到下一个节点. <DEL> 或者 <BACKSPACE> 向上翻页,当处在当前节点的顶部的时候,这两个键可以跳 ...