x <- c(,,,,,,,,,) # build X(predictor) y <- c(,,,,,,,,,) # build Y(dependent variable) mode(x) # view the type of x plot(x,y) # plot the graph model <- lm(y ~ x) # build the linear model abline(model) # add the line in graph 数据是自己编的,所以图有点假. summa
在真实的世界中,缺失数据是经常出现的,并可能对分析的结果造成影响.在R中,经常使用VIM(Visualization and Imputation of Missing values)包来对缺失值进行可视化和插补.在使用VIM绘图时,有些绘图函数会对缺失值会自动进行插补. 缺失数据的分类: MCAR(完全随机缺失):若变量的缺失数据与其他任何观测或未观测的变量都不相关,则数据为MCAR.. MAR(随机缺失):若变量的缺失数据与其他观测变量相关,与未观测变量无关,则数据缺失是随机缺失. NMAR
好多同学跑来问,用spss的时候使用多重插补的数据集,怎么选怎么用?是不是简单的选一个做分析?今天写写这个问题. 什么时候用多重插补 首先回顾下三种缺失机制或者叫缺失类型: 上面的内容之前写过,这儿就不给大家翻译了,完全随机缺失,缺失量较小的情况下你直接扔掉或者任你怎么插补都可以,影响不大的.随机缺失可以用多重插补很好地处理:非随机缺失,任何方法都没得救的,主分析做完之后自觉做敏感性分析才是正道:这个我好像在之前的文章中给大家解释过原因. When it is plausible that da