SPSS数据分析—对数线性模型
我们之前讲Logistic回归模型的时候说过,分类数据在使用卡方检验的时候,当分类过多或者每个类别的水平数过多时,单元格会划分的非常细,有可能会导致大量单元格频数很小甚至为0,并且卡方检验虽然可以分析因素作用,但是无法描述作用的大小和方向,并且无法进一步考察因素间的交互作用,这些都是卡方检验的局限,实际上卡方检验更多的用于行列交叉表,也就是列联表的分析。
以上问题似乎可以使用方差分析解决,但是方差分析仅适用于连续变量,对于分类变量除了可以使用Logistic回归之外,还可以使用对数线性模型,对数线性模型的构造和方差分析模型类似,其作用也一样,可以看做是分类数据的方差分析模型,但是不同点在于,对数线性模型不区分因变量与自变量,并且假定单元格观察频数服从多项分布而不是正态分布,因此二者采用的计算方法也不相同。
对数线性模型在SPSS中有专门的过程,分为三个子过程,这三个子过程侧重不同,分别为
1.常规
适用于对某些特定效应进行分析,只考虑因素之间是否相关,不考虑因果
2.Logit
适用于已明确区分出因变量与自变量,并且因变量为二分类变量,分析的目的是因变量和自变量的关系,实际上这个结果和Logistic回归是等价的,在Logistic回归过程中,也有选择交互作用的按钮。
3.模型选择
拟合的是分层对数线性模型,适用于探索性分析,没有具体分出因变量和自变量,也没有预先对某些效应感兴趣,只是设想某些变量可能存在联系,并无明确假设,该模型输出的结果最为详细且繁杂。
下面我们分别来看这三个过程
一、常规
我们还是以二分类Logistic回归模型的例子来作说明
分析—对数线性模型—常规





二、Logit
我们知道Logit过程适用于对因变量和自变量已有确定的情况,现在我们以该过程拟合上面的数据



三、模型选择
前面说过,模型选择过程只是设想某些变量可能存在联系,属于探索性分析,因此该过程可以利用分层对数线性模型进行模型选择。
我们知道饱和模型最为准确但结果也最为复杂,不饱和模型结果准确性降低但是模型精简,在实际应用中,准确性和模型简约程度 都很重要,需要在这二者间做出权衡,而模型选择就可以帮助我们得到最佳的简约模型,它类似于逐步回归,从饱和模型入手,从 高阶交互作用开始逐步排除无意义的参数,但是结果只能输出饱和模型的参数,对于精简后的模型参数,需要再另外估计。
我们还是以上面的例子入手,展示模型选择中对交互作用的选择。




SPSS数据分析—对数线性模型的更多相关文章
- SPSS数据分析—广义线性模型
我们前面介绍的一般线性模型.Logistic回归模型.对数线性模型.Poisson回归模型等,实际上均属于广义线性模型的范畴,广义 线性模型包含的范围非常广泛,原因在于其对于因变量.因变量的概率分布等 ...
- SPSS数据分析—混合线性模型
之前介绍过的基于线性模型的方差分析,虽然扩展了方差分析的领域,但是并没有突破方差分析三个原有的假设条件,即正态性.方差齐性和独立性,这其中独立性要求较严格,我们知道方差分析的基本思想其实就是细分,将所 ...
- SPSS统计分析过程包括描述性统计、均值比较、一般线性模型、相关分析、回归分析、对数线性模型、聚类分析、数据简化、生存分析、时间序列分析、多重响应等几大类
https://www.zhihu.com/topic/19582125/top-answershttps://wenku.baidu.com/search?word=spss&ie=utf- ...
- SPSS数据分析—Poisson回归模型
在对数线性模型中,我们假设单元格频数分布为多项式分布,但是还有一类分类变量分布也是经常用到的,就是Poisson分布. Poisson分布是某件事发生次数的概率分布,用于描述单位时间.单位面积.单位空 ...
- SPSS数据分析方法不知道如何选择
一提到数学,高等数学,线性代数,概率论与数理统计,数值分析,空间解析几何这些数学课程,头疼呀.作为文科生,遇见这些课程时,通常都是各种寻求帮助,班上有位宅男数学很厉害,各种被女生‘围观’,这数学为 ...
- 快速掌握SPSS数据分析
SPSS难吗?无非就是数据类型的区别后,就能理解应该用什么样的分析方法,对应着分析方法无非是找一些参考资料进行即可.甚至在线网页SPSS软件直接可以将数据分析结果指标人工智能地分析出来,这有多难呢 ...
- SPSS数据分析—广义线性混合模型
广义线性混合模型是目前线性模型范畴内最为完备的模型框架,它是广义线性模型的进一步延伸,进一步突破适用条件,因变量既 可以非正态,也可以非独立,由于其最为复杂,因此SPSS对其输出结果采用模型格式,而不 ...
- SPSS数据分析—二分类Logistic回归模型
对于分类变量,我们知道通常使用卡方检验,但卡方检验仅能分析因素的作用,无法继续分析其作用大小和方向,并且当因素水平过多时,单元格被划分的越来越细,频数有可能为0,导致结果不准确,最重要的是卡方检验不能 ...
- SPSS数据分析—生存分析
生存分析是对生存时间进行统计分析的一种技术,所谓生存时间,就是指从某一时间点起到所关心的事件发生的这段时间.这里的时间不一定就是钟表日历上的时间,也有可能是其他的度量单位,比如长度单位等. 生存时间有 ...
随机推荐
- Prince2七大主题之风险
Prince2七大主题之风险 我们前几个节学习了PRINCE2七大主题的商业论证.组织.质量和计划,今天我们开展对于风险模块的讲解. 风险:目的是识别.评估和控制不确定性,从而提高项目的成功率.P ...
- fso查找被删除的文件
<html> <head> </head> <body> 源目录:<input id="txtOld" value=" ...
- three.js初涉略(一)
<!-- 最近要研究一下webgl,发现了webgl中文网(http://www.hewebgl.com/article/articledir/1).边研究教程边做下记录 --> thre ...
- 最常用的ES6特性
遇到了要写出es6新特性的题目,所以查阅了资料来总结一下,点击查看原文. 进入正题,最常用的ES6特性有:let, const, class, extends, super, arrow functi ...
- Nodejs基础中间件
Nodejs基础中间件Connect http://www.tuicool.com/articles/emeuie 关于作者 张丹(Conan), 程序员Java,R,PHP,Javascript ...
- mysql xml 参数
drop PROCEDURE IF EXISTS tt;CREATE PROCEDURE tt(para text,OUT para1 DECIMAL(18, 6),OUT para2 DECIMAL ...
- 立即执行函数: (function(){...})() 与 (function(){...}()) 有什么区别?
没有区别. function foo() {...} // 这是定义,Declaration:定义只是让解释器知道其存在,但是不会运行. foo(); // 这是语句,Statement:解释器遇到语 ...
- Uva 1630 折叠串
题目链接:https://uva.onlinejudge.org/external/16/1630.pdf 题意:折叠串,给一个字符串,相同部分可以折叠,折叠可以嵌套.求最短长度的一种折叠方法.括号和 ...
- laravel框架总结(十三) -- redis使用
一切的前提都是已经安装好了redis服务器,并且能启动(我只总结了mac的安装方法:传送门) 我自己使用的是mac系统,有个教程可以参考下,传送门: 1.安装PHP PRedis 1>PRedi ...
- Client Window坐标 RECT相关函数
GetClientRect(HWND, RECT*) ---得到窗口的客户区大小,left,top总是0,bottom是客户区高度,right是客户区宽度 GetWindowRect(HWND, RE ...