SPSS数据分析—对数线性模型
我们之前讲Logistic回归模型的时候说过,分类数据在使用卡方检验的时候,当分类过多或者每个类别的水平数过多时,单元格会划分的非常细,有可能会导致大量单元格频数很小甚至为0,并且卡方检验虽然可以分析因素作用,但是无法描述作用的大小和方向,并且无法进一步考察因素间的交互作用,这些都是卡方检验的局限,实际上卡方检验更多的用于行列交叉表,也就是列联表的分析。
以上问题似乎可以使用方差分析解决,但是方差分析仅适用于连续变量,对于分类变量除了可以使用Logistic回归之外,还可以使用对数线性模型,对数线性模型的构造和方差分析模型类似,其作用也一样,可以看做是分类数据的方差分析模型,但是不同点在于,对数线性模型不区分因变量与自变量,并且假定单元格观察频数服从多项分布而不是正态分布,因此二者采用的计算方法也不相同。
对数线性模型在SPSS中有专门的过程,分为三个子过程,这三个子过程侧重不同,分别为
1.常规
适用于对某些特定效应进行分析,只考虑因素之间是否相关,不考虑因果
2.Logit
适用于已明确区分出因变量与自变量,并且因变量为二分类变量,分析的目的是因变量和自变量的关系,实际上这个结果和Logistic回归是等价的,在Logistic回归过程中,也有选择交互作用的按钮。
3.模型选择
拟合的是分层对数线性模型,适用于探索性分析,没有具体分出因变量和自变量,也没有预先对某些效应感兴趣,只是设想某些变量可能存在联系,并无明确假设,该模型输出的结果最为详细且繁杂。
下面我们分别来看这三个过程
一、常规
我们还是以二分类Logistic回归模型的例子来作说明
分析—对数线性模型—常规





二、Logit
我们知道Logit过程适用于对因变量和自变量已有确定的情况,现在我们以该过程拟合上面的数据



三、模型选择
前面说过,模型选择过程只是设想某些变量可能存在联系,属于探索性分析,因此该过程可以利用分层对数线性模型进行模型选择。
我们知道饱和模型最为准确但结果也最为复杂,不饱和模型结果准确性降低但是模型精简,在实际应用中,准确性和模型简约程度 都很重要,需要在这二者间做出权衡,而模型选择就可以帮助我们得到最佳的简约模型,它类似于逐步回归,从饱和模型入手,从 高阶交互作用开始逐步排除无意义的参数,但是结果只能输出饱和模型的参数,对于精简后的模型参数,需要再另外估计。
我们还是以上面的例子入手,展示模型选择中对交互作用的选择。




SPSS数据分析—对数线性模型的更多相关文章
- SPSS数据分析—广义线性模型
我们前面介绍的一般线性模型.Logistic回归模型.对数线性模型.Poisson回归模型等,实际上均属于广义线性模型的范畴,广义 线性模型包含的范围非常广泛,原因在于其对于因变量.因变量的概率分布等 ...
- SPSS数据分析—混合线性模型
之前介绍过的基于线性模型的方差分析,虽然扩展了方差分析的领域,但是并没有突破方差分析三个原有的假设条件,即正态性.方差齐性和独立性,这其中独立性要求较严格,我们知道方差分析的基本思想其实就是细分,将所 ...
- SPSS统计分析过程包括描述性统计、均值比较、一般线性模型、相关分析、回归分析、对数线性模型、聚类分析、数据简化、生存分析、时间序列分析、多重响应等几大类
https://www.zhihu.com/topic/19582125/top-answershttps://wenku.baidu.com/search?word=spss&ie=utf- ...
- SPSS数据分析—Poisson回归模型
在对数线性模型中,我们假设单元格频数分布为多项式分布,但是还有一类分类变量分布也是经常用到的,就是Poisson分布. Poisson分布是某件事发生次数的概率分布,用于描述单位时间.单位面积.单位空 ...
- SPSS数据分析方法不知道如何选择
一提到数学,高等数学,线性代数,概率论与数理统计,数值分析,空间解析几何这些数学课程,头疼呀.作为文科生,遇见这些课程时,通常都是各种寻求帮助,班上有位宅男数学很厉害,各种被女生‘围观’,这数学为 ...
- 快速掌握SPSS数据分析
SPSS难吗?无非就是数据类型的区别后,就能理解应该用什么样的分析方法,对应着分析方法无非是找一些参考资料进行即可.甚至在线网页SPSS软件直接可以将数据分析结果指标人工智能地分析出来,这有多难呢 ...
- SPSS数据分析—广义线性混合模型
广义线性混合模型是目前线性模型范畴内最为完备的模型框架,它是广义线性模型的进一步延伸,进一步突破适用条件,因变量既 可以非正态,也可以非独立,由于其最为复杂,因此SPSS对其输出结果采用模型格式,而不 ...
- SPSS数据分析—二分类Logistic回归模型
对于分类变量,我们知道通常使用卡方检验,但卡方检验仅能分析因素的作用,无法继续分析其作用大小和方向,并且当因素水平过多时,单元格被划分的越来越细,频数有可能为0,导致结果不准确,最重要的是卡方检验不能 ...
- SPSS数据分析—生存分析
生存分析是对生存时间进行统计分析的一种技术,所谓生存时间,就是指从某一时间点起到所关心的事件发生的这段时间.这里的时间不一定就是钟表日历上的时间,也有可能是其他的度量单位,比如长度单位等. 生存时间有 ...
随机推荐
- icon fonts
iconfont网站 http://www.iconfont.cn(推荐) http://fontello.com/ http://fontawesome.io/ https://icomoon. ...
- 关于32位windows和64位windows
SysWow64文件夹,是64位Windows,用来存放32位Windows系统文件的地方,而System32文件夹,是用来存放64位程序文件的地方. 当32位程序加载System32文件夹中的dll ...
- &和&&的区别
&和&&都可以用作逻辑与的运算符,表示逻辑与(and),当运算符两边的表达式的结果都为true时,整个运算结果才为true,否则,只要有一方为false,则结果为false. ...
- sqlite嵌入式数据库C语言基本操作(2)
:first-child{margin-top:0!important}img.plugin{box-shadow:0 1px 3px rgba(0,0,0,.1);border-radius:3px ...
- jdbc的实例应用:增删查改实现
//在jdbc中进行增删查改 //查看所有 public static void findAll() { String url = "jdbc:mysql://localhost:3306/ ...
- Pro Git 第一章 起步 读书笔记
Pro Git 笔记 第1章 起步 1.文件的三种状态. 已提交:文件已经保存在本地数据库中了.(commit) 已修改:修改了某个文件,但还没有提交保存.(vim) 已暂存:已经把已修改的文件放在下 ...
- C扩展python的module和Type
有许多理由给CPython写扩展,比如 1.性能低 2.重复用别人的C/C++代码 3.在自己的程序中定制python 4.为了方便 等等. 写这种扩展其实都是套路,不过最好要有对CPython源码有 ...
- java中变量命名和引用变量的一个坑
这次有两个主题,第一个太简单啦,就是java中变量的命名规则,纯记忆性东西.第二个主题,就是讨论一下对象引用变量的一个注意点.
- 使用xfire工具搭建webservice
一个简单的项目,下载下来导入可以直接使用 https://yunpan.cn/cY8ANUAYLgy7s 访问密码 99e3
- SQL-Server使用点滴(二)
二,对象的建立和使用 1,了解MSSql的[系统表] 对于SQL-Server中的所有对象,包括数据库,数据表,记录,字段,触发器,索引,数据类型等元素,均有对应的系统表记性记录.系统表是禁止直接删改 ...