今天给大家介绍分段潜增长模型的原理和做法,之前我有给大家写增长混合和潜增长,它们的主要的局限在于轨迹都是连续的不能分段,在于对phasic的现象把握其实还是不够的,比如儿童认知的发展,按照理论,它是可以明显分段的,如果这个时候我们非要给人家拟合一个连续曲线?万一人家发展就是分了两个阶段线性发展的呢?所以这些方法还是不太好,今天给大家介绍分段潜增长模型,专门解决这个问题。

理论铺垫

增长混合模型之前有给大家写,其优点在于可以看轨迹,局限性在于趋势不好解释。什么意思呢,其实很多时候我们拟合不出来一组十分有意义的轨迹的,这个时候我们可以转而看轨迹内部发展的情况,往往可以挽救一个课题。

就是说我们将纵向轨迹分段解释,像下图有可能就有意思了,或者是自己本来就是一个很长时间随访的数据,比如从6岁随访到18岁,有可能12岁是一个转折点,这个时候我们以12岁为界拟合两段斜率,有可能更加符合实际。或者是理论告诉我,我研究的特质本来在6到18岁本来就应该是2个发展阶段,这个时候我们也应该用分段增长模型来拟合特质的发展情况:

Piecewise growth curve model (PGCM) is often used when the underlying growth process is hypothesized to consist of phasic developments connected by turning points (or knots or change points)

the piecewise growth model is quite flexible and can accommodate a variety of modeling scenarios that are not adequately captured by mathematical functions for single-stage change processes and/or often yield parameters with more meaningful and substantive interpretations.

不止如此,更重要的是我们可以同时做两个变量的分段增长模型,此时有助于我们回答一些诸如:两个变量的Codevelopment是怎样的?一个变量的发展快慢对另外一个变量的发展快慢是不是有影响?一个变量的初始水平是不是对另外一个变量的发展有影响?等等。这些都是很有意思的课题凝练方法,有长期随访数据的同学们都可以考虑一下哈。

分段增长曲线的内在思想大部分和增长曲线模型是一样的,不同之处在于我们会在一个轨迹中拟合两个斜率出来,如下图:

图中就显示我们对学生的数学成绩随访6次,此时我们形成3个潜变量,一个截距,2个斜率,斜率s1代表了8,9,10三波成绩的斜率,而斜率s2代表了以10波为起点的11,12波的斜率。这样子一拟合我们就可以得知以10波为界,不同阶段的数学成绩是如何变化的了。

文献实例

今天我们看的文献是来自jamapsychiatry上的一篇文章,作者利用分段增长曲线模型探讨了BMI和内化症状的共同发展情况,叫做Codevelopment,就是说我BMI发展的快是不是也使得内化问题发展的严重,或者相反;是不是基础的BMI或BMI不同阶段发展的快慢对不同阶段内化症状发展的也有预测作用,或者相反。

上面问题的回答都是通过对BMI和内化症状同时做分段增长曲线,然后探讨曲线的斜率截距之间的关系实现的,原文献贴在下面感兴趣的同学可以去读一读:

Patalay P, Hardman CA. Comorbidity, Codevelopment, and Temporal Associations Between Body Mass Index and Internalizing Symptoms From Early Childhood to Adolescence. JAMA Psychiatry. 2019;76(7):721–729. doi:10.1001/jamapsychiatry.2019.0169

文章有两个表值得给大家分享下:

第一个是一个曲线参数相关系数的表格,如下:

作者做了两个变量共6个轨迹参数之间的两两相关,作者通过看斜率的相关,就解答了codevelopment这个问题,比如3岁到7岁之间两个斜率的相关系数为0.01且不显著,作者得到说其实在3到7岁这个时期,BMI和内化症状是没有共同发展的。相应地,7到14岁这个时期两个斜率的相关系数为0.23且显著,所以这个时期BMI和内化症状其实是共同发展的。

要分享的第二个表格是回归的表格,如下:

作者想看一看相应症状发展的斜率(速率)是如何被相应轨迹参数预测的,因为从表3可以看出各自变量的截距对各自变量变化的斜率都是有显著预测作用的,而相互之间,即BMI的截距对内化问题的斜率与内化问题的截距对BMI的斜率都没有影响,所以作者就得到了:BMI发展和内化症状发展之间并没有交叉预测作用:

initial levels in each domain predicted the slopes in the same domain.However,there were no cross-domain predictions from the initial level or the rate of change (slopes) and the rate of development in the other domain

实例操练

比如我现在有某个变量的5次随访,我想对这5次随访做一个分段增长模型以第3波为截断点,我就可以写出如下代码

可以看到在代码中,有拟合两个斜率s1和s2,s1是以y1为起点,一直到y3,而s2是以y3为起点一直到y5,运行代码即可出图并得到轨迹参数:

分段增长曲线的模型如下:

今天给大家写了分段增长模型的mplus做法,R语言的BayesianPGMM包也是专门用来做分段增长模型的,以后有机会给大家写做法。当然啦,大家也可以像刚刚分享的jamapsychiatry那篇文章一样,拟合两个分段增长模型去探讨变量间的纵向共变关系,得到意想不到的结论。

小结

今天给大家写了分段潜增长模型,感谢大家耐心看完,自己的文章都写的很细,重要代码都在原文中,希望大家都可以自己做一做,请转发本文到朋友圈后私信回复“数据链接”获取所有数据和本人收集的学习资料。如果对您有用请先记得收藏,再点赞分享。

也欢迎大家的意见和建议,大家想了解什么统计方法都可以在文章下留言,说不定我看见了就会给你写教程哦,有疑问欢迎私信,有合作意向请莫要犹豫直接滴滴我。

Mplus数据分析:分段潜增长模型,看jama如何玩转纵向数据的轨迹的更多相关文章

  1. mplus数据分析:增长模型潜增长模型与增长混合模型再解释

    混合模型,增长混合模型这些问题咨询的同学还是比较多的,今天再次尝试写写它们的区别,希望对大家进一步理解两种做轨迹的方法有帮助. 首先,无论是LCGA还是GMM,它们都是潜增长模型的框框里面的东西: L ...

  2. 从信用卡欺诈模型看不平衡数据分类(1)数据层面:使用过采样是主流,过采样通常使用smote,或者少数使用数据复制。过采样后模型选择RF、xgboost、神经网络能够取得非常不错的效果。(2)模型层面:使用模型集成,样本不做处理,将各个模型进行特征选择、参数调优后进行集成,通常也能够取得不错的结果。(3)其他方法:偶尔可以使用异常检测技术,IF为主

    总结:不平衡数据的分类,(1)数据层面:使用过采样是主流,过采样通常使用smote,或者少数使用数据复制.过采样后模型选择RF.xgboost.神经网络能够取得非常不错的效果.(2)模型层面:使用模型 ...

  3. R数据分析:潜类别轨迹模型LCTM的做法,实例解析

    最近看了好多潜类别轨迹latent class trajectory models的文章,发现这个方法和我之前常用的横断面数据的潜类别和潜剖面分析完全不是一个东西,做纵向轨迹的正宗流派还是这个方法,当 ...

  4. 潜类别模型(Latent Class Modeling)

    1.潜类别模型概述 潜在类别模型(Latent Class Model, LCM; Lazarsfeld & Henry, 1968)或潜在类别分析(Latent Class Analysis ...

  5. 用户增长模型AARRR模型

    用户增长模型AARRR模型

  6. R数据分析:纵向数据如何做中介,交叉滞后中介模型介绍

    看似小小的中介,废了我好多脑细胞,这个东西真的不简单,从7月份有人问我,我多重中介,到现在的纵向数据中介,从一般的回归做法,到结构方程框架下的路径分析法,到反事实框架做法,从中介变量和因变量到是连续变 ...

  7. 【Social listening实操】作为一个合格的“增长黑客”,你还得重视外部数据的分析!

    本文转自知乎 作者:苏格兰折耳喵 ----------------------------------------------------- 在本文中,作者引出了"外部数据"这一概 ...

  8. 【爬虫+数据分析+数据可视化】python数据分析全流程《2021胡润百富榜》榜单数据!

    目录 一.爬虫 1.1 爬取目标 1.2 分析页面 1.3 爬虫代码 1.4 结果数据 二.数据分析 2.1 导入库 2.2 数据概况 2.3 可视化分析 2.3.1 财富分布 2.3.2 年龄分布 ...

  9. Django 08 Django模型基础3(关系表的数据操作、表关联对象的访问、多表查询、聚合、分组、F、Q查询)

    Django 08 Django模型基础3(关系表的数据操作.表关联对象的访问.多表查询.聚合.分组.F.Q查询) 一.关系表的数据操作 #为了能方便学习,我们进入项目的idle中去执行我们的操作,通 ...

  10. PLUTO平台是由美林数据技术股份有限公司下属西安交大美林数据挖掘研究中心自主研发的一款基于云计算技术架构的数据挖掘产品,产品设计严格遵循国际数据挖掘标准CRISP-DM(跨行业数据挖掘过程标准),具备完备的数据准备、模型构建、模型评估、模型管理、海量数据处理和高纬数据可视化分析能力。

    http://www.meritdata.com.cn/article/90 PLUTO平台是由美林数据技术股份有限公司下属西安交大美林数据挖掘研究中心自主研发的一款基于云计算技术架构的数据挖掘产品, ...

随机推荐

  1. 《赵渝强》《Docker+Kubernetes容器实战派》新书上市!!!

    用一本书掌握Docker与Kubernetes核心内容!!! 本书基于作者多年的教学与实践经验编写,分为上下两篇,共20章. 上篇(第1-11章)介绍Docoker,包含:Docker入门.Docke ...

  2. oh-my-zsh nvm command not found

    oh-my-zsh nvm command not found 如果你在使用 oh-my-zsh 并且在终端输入 nvm 命令时提示 "command not found",这可能 ...

  3. vue2 + webpack 分析报告 report == webpack-bundle-analyzer

    packjson.js 配置 "build-report":"vue-cli-service build --report", 执行 : npm run bui ...

  4. npm install报错 Error: EACCES: permission denied

    报错内容 Unable to save binary /root/packageadmin/spring-boot-admin-2.1.6/spring-boot-admin-server-ui/no ...

  5. 关系图谱后端不给指向性字段使用children

    .markdown-body { line-height: 1.75; font-weight: 400; font-size: 16px; overflow-x: hidden; color: rg ...

  6. 云原生爱好者周刊:利用 DNS 计算圆周率

    开源项目推荐 dns.toys dns.toys 是一个比较有创意的 DNS 服务器,它利用 DNS 协议提供了很多非常有趣的功能和服务.例如查询时间.天气.圆周率.单位换算等等. Submarine ...

  7. Java 当中使用 “google.zxing ”开源项目 和 “github 的 qrcode-plugin” 开源项目 生成二维码

    Java 当中使用 "google.zxing "开源项目 和 "github 的 qrcode-plugin" 开源项目 生成二维码 @ 目录 Java 当中 ...

  8. LookupViT:类似SE的token压缩方案,加速还能丰富特征 | ECCV'24

    视觉变换器(ViT)已成为众多工业级视觉解决方案的事实标准选择.但由于每一层都计算自注意力,这导致其推理成本对许多场景而言是不可接受的,因为自注意力在标记数量上具有平方的计算复杂度.另一方面,图像中的 ...

  9. Uniswap V2 核心 合约代码

    Uniswap V2 核心 UniswapV2Factory UniswapV2Pair UniswapV2ERC20 IUniswapV2Router02 1. UniswapV2Factory 合 ...

  10. Nuxt.js 应用中的 schema:extend事件钩子详解

    title: Nuxt.js 应用中的 schema:extend事件钩子详解 date: 2024/11/10 updated: 2024/11/10 author: cmdragon excerp ...