Mplus数据分析:分段潜增长模型,看jama如何玩转纵向数据的轨迹
今天给大家介绍分段潜增长模型的原理和做法,之前我有给大家写增长混合和潜增长,它们的主要的局限在于轨迹都是连续的不能分段,在于对phasic的现象把握其实还是不够的,比如儿童认知的发展,按照理论,它是可以明显分段的,如果这个时候我们非要给人家拟合一个连续曲线?万一人家发展就是分了两个阶段线性发展的呢?所以这些方法还是不太好,今天给大家介绍分段潜增长模型,专门解决这个问题。
理论铺垫
增长混合模型之前有给大家写,其优点在于可以看轨迹,局限性在于趋势不好解释。什么意思呢,其实很多时候我们拟合不出来一组十分有意义的轨迹的,这个时候我们可以转而看轨迹内部发展的情况,往往可以挽救一个课题。
就是说我们将纵向轨迹分段解释,像下图有可能就有意思了,或者是自己本来就是一个很长时间随访的数据,比如从6岁随访到18岁,有可能12岁是一个转折点,这个时候我们以12岁为界拟合两段斜率,有可能更加符合实际。或者是理论告诉我,我研究的特质本来在6到18岁本来就应该是2个发展阶段,这个时候我们也应该用分段增长模型来拟合特质的发展情况:
Piecewise growth curve model (PGCM) is often used when the underlying growth process is hypothesized to consist of phasic developments connected by turning points (or knots or change points)
the piecewise growth model is quite flexible and can accommodate a variety of modeling scenarios that are not adequately captured by mathematical functions for single-stage change processes and/or often yield parameters with more meaningful and substantive interpretations.
不止如此,更重要的是我们可以同时做两个变量的分段增长模型,此时有助于我们回答一些诸如:两个变量的Codevelopment是怎样的?一个变量的发展快慢对另外一个变量的发展快慢是不是有影响?一个变量的初始水平是不是对另外一个变量的发展有影响?等等。这些都是很有意思的课题凝练方法,有长期随访数据的同学们都可以考虑一下哈。
分段增长曲线的内在思想大部分和增长曲线模型是一样的,不同之处在于我们会在一个轨迹中拟合两个斜率出来,如下图:
图中就显示我们对学生的数学成绩随访6次,此时我们形成3个潜变量,一个截距,2个斜率,斜率s1代表了8,9,10三波成绩的斜率,而斜率s2代表了以10波为起点的11,12波的斜率。这样子一拟合我们就可以得知以10波为界,不同阶段的数学成绩是如何变化的了。
文献实例
今天我们看的文献是来自jamapsychiatry上的一篇文章,作者利用分段增长曲线模型探讨了BMI和内化症状的共同发展情况,叫做Codevelopment,就是说我BMI发展的快是不是也使得内化问题发展的严重,或者相反;是不是基础的BMI或BMI不同阶段发展的快慢对不同阶段内化症状发展的也有预测作用,或者相反。
上面问题的回答都是通过对BMI和内化症状同时做分段增长曲线,然后探讨曲线的斜率截距之间的关系实现的,原文献贴在下面感兴趣的同学可以去读一读:
Patalay P, Hardman CA. Comorbidity, Codevelopment, and Temporal Associations Between Body Mass Index and Internalizing Symptoms From Early Childhood to Adolescence. JAMA Psychiatry. 2019;76(7):721–729. doi:10.1001/jamapsychiatry.2019.0169
文章有两个表值得给大家分享下:
第一个是一个曲线参数相关系数的表格,如下:
作者做了两个变量共6个轨迹参数之间的两两相关,作者通过看斜率的相关,就解答了codevelopment这个问题,比如3岁到7岁之间两个斜率的相关系数为0.01且不显著,作者得到说其实在3到7岁这个时期,BMI和内化症状是没有共同发展的。相应地,7到14岁这个时期两个斜率的相关系数为0.23且显著,所以这个时期BMI和内化症状其实是共同发展的。
要分享的第二个表格是回归的表格,如下:
作者想看一看相应症状发展的斜率(速率)是如何被相应轨迹参数预测的,因为从表3可以看出各自变量的截距对各自变量变化的斜率都是有显著预测作用的,而相互之间,即BMI的截距对内化问题的斜率与内化问题的截距对BMI的斜率都没有影响,所以作者就得到了:BMI发展和内化症状发展之间并没有交叉预测作用:
initial levels in each domain predicted the slopes in the same domain.However,there were no cross-domain predictions from the initial level or the rate of change (slopes) and the rate of development in the other domain
实例操练
比如我现在有某个变量的5次随访,我想对这5次随访做一个分段增长模型以第3波为截断点,我就可以写出如下代码
可以看到在代码中,有拟合两个斜率s1和s2,s1是以y1为起点,一直到y3,而s2是以y3为起点一直到y5,运行代码即可出图并得到轨迹参数:
分段增长曲线的模型如下:
今天给大家写了分段增长模型的mplus做法,R语言的BayesianPGMM包也是专门用来做分段增长模型的,以后有机会给大家写做法。当然啦,大家也可以像刚刚分享的jamapsychiatry那篇文章一样,拟合两个分段增长模型去探讨变量间的纵向共变关系,得到意想不到的结论。
小结
今天给大家写了分段潜增长模型,感谢大家耐心看完,自己的文章都写的很细,重要代码都在原文中,希望大家都可以自己做一做,请转发本文到朋友圈后私信回复“数据链接”获取所有数据和本人收集的学习资料。如果对您有用请先记得收藏,再点赞分享。
也欢迎大家的意见和建议,大家想了解什么统计方法都可以在文章下留言,说不定我看见了就会给你写教程哦,有疑问欢迎私信,有合作意向请莫要犹豫直接滴滴我。
Mplus数据分析:分段潜增长模型,看jama如何玩转纵向数据的轨迹的更多相关文章
- mplus数据分析:增长模型潜增长模型与增长混合模型再解释
混合模型,增长混合模型这些问题咨询的同学还是比较多的,今天再次尝试写写它们的区别,希望对大家进一步理解两种做轨迹的方法有帮助. 首先,无论是LCGA还是GMM,它们都是潜增长模型的框框里面的东西: L ...
- 从信用卡欺诈模型看不平衡数据分类(1)数据层面:使用过采样是主流,过采样通常使用smote,或者少数使用数据复制。过采样后模型选择RF、xgboost、神经网络能够取得非常不错的效果。(2)模型层面:使用模型集成,样本不做处理,将各个模型进行特征选择、参数调优后进行集成,通常也能够取得不错的结果。(3)其他方法:偶尔可以使用异常检测技术,IF为主
总结:不平衡数据的分类,(1)数据层面:使用过采样是主流,过采样通常使用smote,或者少数使用数据复制.过采样后模型选择RF.xgboost.神经网络能够取得非常不错的效果.(2)模型层面:使用模型 ...
- R数据分析:潜类别轨迹模型LCTM的做法,实例解析
最近看了好多潜类别轨迹latent class trajectory models的文章,发现这个方法和我之前常用的横断面数据的潜类别和潜剖面分析完全不是一个东西,做纵向轨迹的正宗流派还是这个方法,当 ...
- 潜类别模型(Latent Class Modeling)
1.潜类别模型概述 潜在类别模型(Latent Class Model, LCM; Lazarsfeld & Henry, 1968)或潜在类别分析(Latent Class Analysis ...
- 用户增长模型AARRR模型
用户增长模型AARRR模型
- R数据分析:纵向数据如何做中介,交叉滞后中介模型介绍
看似小小的中介,废了我好多脑细胞,这个东西真的不简单,从7月份有人问我,我多重中介,到现在的纵向数据中介,从一般的回归做法,到结构方程框架下的路径分析法,到反事实框架做法,从中介变量和因变量到是连续变 ...
- 【Social listening实操】作为一个合格的“增长黑客”,你还得重视外部数据的分析!
本文转自知乎 作者:苏格兰折耳喵 ----------------------------------------------------- 在本文中,作者引出了"外部数据"这一概 ...
- 【爬虫+数据分析+数据可视化】python数据分析全流程《2021胡润百富榜》榜单数据!
目录 一.爬虫 1.1 爬取目标 1.2 分析页面 1.3 爬虫代码 1.4 结果数据 二.数据分析 2.1 导入库 2.2 数据概况 2.3 可视化分析 2.3.1 财富分布 2.3.2 年龄分布 ...
- Django 08 Django模型基础3(关系表的数据操作、表关联对象的访问、多表查询、聚合、分组、F、Q查询)
Django 08 Django模型基础3(关系表的数据操作.表关联对象的访问.多表查询.聚合.分组.F.Q查询) 一.关系表的数据操作 #为了能方便学习,我们进入项目的idle中去执行我们的操作,通 ...
- PLUTO平台是由美林数据技术股份有限公司下属西安交大美林数据挖掘研究中心自主研发的一款基于云计算技术架构的数据挖掘产品,产品设计严格遵循国际数据挖掘标准CRISP-DM(跨行业数据挖掘过程标准),具备完备的数据准备、模型构建、模型评估、模型管理、海量数据处理和高纬数据可视化分析能力。
http://www.meritdata.com.cn/article/90 PLUTO平台是由美林数据技术股份有限公司下属西安交大美林数据挖掘研究中心自主研发的一款基于云计算技术架构的数据挖掘产品, ...
随机推荐
- java基础 -反射笔记
710,反射快速入门 代码: 先创建一个 re.properties 文件: classfullpath=com.hspedu.Cat method=hi Cat.java package com.h ...
- Linux发布ASPNetCore 项目 IIS 部署
Linux系统发布 ASP.ENT Core 项目 Linux系统-CentOS7 ---基于虚拟机来安装 IP:192.168.1.97 安装教程 链接:https://pan.baidu.com/ ...
- 18 . 介绍一下 Promise
Promise 是js内置的构造函数,也叫做期约函数 ,它有 3 种状态 ,等待状态 pending ,成功状态 fullfilled ,失败状态 reject :2 个过程, 等待状态到成功状态 会 ...
- WSL默认安装目录
我当前在win11下进行以下操作,其它系统版本有问题可以留言 一.安装WSL 前提条件:我们需要保证你的操作系统版本满足 **Windows 10 版本 2004 及更高版本(内部版本 19041 及 ...
- 云原生爱好者周刊:揪出 Prometheus 中时间戳抖动
开源项目推荐 O11y toolkit O11y toolkit 是一个工具集,用来维护.调试和增强你的可观测性系统,改善我们日常对指标.日志和链路追踪的使用体验.例如 oy-scrape-jitte ...
- ROS中无法定位软件包问题
ROS 和ubuntu版本对应关系
- 文件操作(C语言)
1. 为什么使用文件? 如果没有文件,我们写的程序的数据是存储在电脑的内存中,如果程序退出,内存回收,数据就丢失了,等再次运行程序,是看不到上次程序的数据的,如果要将数据进行持久化的保存,我们可以使用 ...
- Selenium弹框处理
Selenium中有三种弹框,本文介绍了处理三种弹框的方法 一.Selenium三种弹框 alert:用来提示,显示一个带有指定消息和确认按钮的警告框 confirm:用于确认,显示一个带有指定消息和 ...
- IntelliJ IDEA 设置背景图片 随机快捷更换背景图片(附高清4K背景图N张)
前言 开发过程枯燥乏味,何不为自己工作中添加点乐子呢,除了主题模板,我们可以设置IntelliJ IDEA 的背景图片,换个背景图,换个心情. IntelliJ IDEA 设置背景图片 注意: 必要的 ...
- DearPyGui学习
1.所有DPG应用程序必须做3件事: 创建和销毁上下文 (create_context) 创建和显示视区 (create_viewport.show_viewport) 设置和启动DearPyGui ...