R语言-主成分分析
1.PCA
使用场景:主成分分析是一种数据降维,可以将大量的相关变量转换成一组很少的不相关的变量,这些无关变量称为主成分
步骤:
- 数据预处理(保证数据中没有缺失值)
- 选择因子模型(判断是PCA还是EFA)
- 判断要选择的主成分/因子数目
- 选择主成分
- 旋转主成分
- 解释结果
- 计算主成分或因子的得分
案例:从USJudgeRatings数据集中有11个变量,如何去减化数据(单个主成分分析)
1.使用碎石图确定需要提取的主成分个数
library(psych)
# 1.做出碎石图确定主成分的个数
fa.parallel(USJudgeRatings[,-1],fa='pc',n.iter = 100,show.legend = F,main = 'Scree plot with parallel analysis')

结论:在特征值大于1的的点附近,都表明保留1个主成分即可
2.提取主成分
# 1.第一个参数是关系矩阵
# 2.nfactors指定主成分的个数
# 3.rotate指定旋转方法,默认varimax
# 4.scores表示是否需要计算主成分得分,默认不需要
pc <- principal(USJudgeRatings[,-1],nfactors = 1)
pc

结论:第一主成分与每一个变量高度相关
3.获取主成分得分
pc <- principal(USJudgeRatings[,-1],nfactors = 1,scores = T)
head(pc$scores)
cor(USJudgeRatings$CONT,pc$scores)

4.获取相关系数
cor(USJudgeRatings$CONT,pc$scores)

结论:律师和法官的私交和律师的评级没有关系
案例2:减少女孩身体指标的主成分分析(多个主成分分析)
1.判断个数
fa.parallel(Harman23.cor$cov,n.obs = 203,fa='pc',n.iter = 100,show.legend = F,
main = 'Scree plot with parallel analysis')

结论:有2个点在水平线1上,所以需要2个主成分
2.主成分分析
pc2 <- principal(Harman23.cor$cov,nfactors = 2,rotate = 'none')
pc2

结论:需要对数据旋转作进一步分析
3.主成分旋转(尽可能对成分去噪)
rc <- principal(Harman23.cor$cov,nfactors = 2,rotate = 'varimax')
rc

4.获取主成分的得分系数
round(unclass(rc$weights),2)

结论:可以通过系数*数值来计算出主成分得分
2.EFA
使用场景:探索因子分析发掘数据下一组较少的,无法观测的变量来解释一组可观测变量的相关性
案例:使用EFA对6个心理学测试来检测参与者的得分
1.判断需要提取的因子数
covariances <- ability.cov$cov
correlations <- cov2cor(covariances)
fa.parallel(correlations,n.obs = 112,fa='both',n.iter=100,main = 'Scree plots with parallel analysis')

结论:需要提取2个因子,因为图形在拐点之上有2个分布
2.提取公共因子
fa <- fa(correlations,nfactors = 2,rotate = 'none',fm='pa')
fa

结论:2个因子解释了6个心理学测试的60%方差,需要进一步旋转
fa.varimax <- fa(correlations,nfactors=2,rotate='varimax',fm='pa')
fa.varimax

结论:阅读和词汇在第一个因子占比较大,画图,积木在第二个因子上成分较大,如果想进一步判断这个各因子是否相关,需要使用斜交旋转提取因子
fa.promax <- fa(correlations,nfactors=2,rotate='Promax',fm='pa')
fa.promax

结论:相关性为0.57,相关性很大,如果相关性不大,使用正交旋转即可
3.计算得分
fsm <- function(oblique) {
if (class(oblique)[2]=="fa" & is.null(oblique$Phi)) {
warning("Object doesn't look like oblique EFA")
} else {
P <- unclass(oblique$loading)
F <- P %*% oblique$Phi
colnames(F) <- c("PA1", "PA2")
return(F)
}
}
fsm(fa.promax)

5.正交旋转所得因子得分图

结论:词汇和阅读在第一因子上载荷较大,图片,迷宫,积木在第二个因子上载荷较大,普通智力检测在二者的分布较为平均
6.斜交旋转所生成的因子图
fa.diagram(fa.promax,simple = F)

结论:显示了因子之间的关系,该图比上一张图更为准确
R语言-主成分分析的更多相关文章
- R语言主成分分析(PCA)
数据的导入 > data=read.csv('F:/R语言工作空间/pca/data.csv') #数据的导入> > ls(data) #ls()函数列出所有变量 [1] " ...
- 【转】R语言主成分分析(PCA)
https://www.cnblogs.com/jin-liang/p/9064020.html 数据的导入 > data=read.csv('F:/R语言工作空间/pca/data.csv') ...
- 主成分分析(PCA)原理及R语言实现
原理: 主成分分析 - stanford 主成分分析法 - 智库 主成分分析(Principal Component Analysis)原理 主成分分析及R语言案例 - 文库 主成分分析法的原理应用及 ...
- 主成分分析(PCA)原理及R语言实现 | dimension reduction降维
如果你的职业定位是数据分析师/计算生物学家,那么不懂PCA.t-SNE的原理就说不过去了吧.跑通软件没什么了不起的,网上那么多教程,copy一下就会.关键是要懂其数学原理,理解算法的假设,适合解决什么 ...
- 主成分分析、实例及R语言原理实现
欢迎批评指正! 主成分分析(principal component analysis,PCA) 一.几何的角度理解PCA -- 举例:将原来的三维空间投影到方差最大且线性无关的两个方向(二维空间). ...
- PCA主成分分析 R语言
1. PCA优缺点 利用PCA达到降维目的,避免高维灾难. PCA把所有样本当作一个整体处理,忽略了类别属性,所以其丢掉的某些属性可能正好包含了重要的分类信息 2. PCA原理 条件1:给定一个m*n ...
- 数据分析与R语言
数据结构 创建向量和矩阵 函数c(), length(), mode(), rbind(), cbind() 求平均值,和,连乘,最值,方差,标准差 函数mean(), sum(), min(), m ...
- 零基础数据分析与挖掘R语言实战课程(R语言)
随着大数据在各行业的落地生根和蓬勃发展,能从数据中挖金子的数据分析人员越来越宝贝,于是很多的程序员都想转行到数据分析, 挖掘技术哪家强?当然是R语言了,R语言的火热程度,从TIOBE上编程语言排名情况 ...
- R语言学习路线和常用数据挖掘包(转)
对于初学R语言的人,最常见的方式是:遇到不会的地方,就跑到论坛上吼一嗓子,然后欣然or悲伤的离去,一直到遇到下一个问题再回来.当然,这不是最好的学习方式,最好的方式是——看书.目前,市面上介绍R语言的 ...
随机推荐
- 织梦DedeCms获取当前页面URL地址的调用方法
织梦内容页如何调用当前页面url?相信很多对织梦感兴趣的朋友都会去考虑这个问题:在文章内容中加入本文链接,除了 保护自己版权外还可以增加网站的外链收录.网上这方面的帖子一搜一大堆,但多数都只能调用相对 ...
- dede内容页调用图片集下所有图片方法!
http://blog.csdn.net/forest_fire/article/details/50943765 版权声明:本文为博主原创文章,未经博主允许不得转载. {dede:productim ...
- Python 3 利用 Dlib 19.7 和 sklearn机器学习模型 实现人脸微笑检测
0.引言 利用机器学习的方法训练微笑检测模型,给一张人脸照片,判断是否微笑: 使用的数据集中69张没笑脸,65张有笑脸,训练结果识别精度在95%附近: 效果: 图1 示例效果 工程利用pytho ...
- iOS enum 定义与使用
枚举其实很重要,特别是在应用开发初期,服务器端数据格式需要更改得情况下,枚举和宏都能是程序简洁,并且改动小. 网上有个人写的言简意赅,适合初学 转自:http://blog.csdn.net/ysy4 ...
- Java hashtable和hastmap的区别
1. 继承和实现区别 Hashtable是基于陈旧的Dictionary类,完成了Map接口:HashMap是Java 1.2引进的Map接口的一个实现(HashMap继承于AbstractMap,A ...
- js中this详解
this对象是在闭包一节中提到的,书上的原话是:"this对象是在运行时基于函数的执行环境绑定的,在全局函数中,this等于window,而当函数作为某个对象的方法调用时,this等于那个对 ...
- 自己动手搭建一个简易的SpringBoot环境
什么是springboot? Spring Boot俗称微服务.Spring Boot是由Pivotal团队提供的全新框架,其设计目的是用来简化新Spring应用的初始搭建以及开发过程.该框架使用了特 ...
- _2_head_中标签
创:20_3_2017修:5_4_2017 什么是title标签? --title 页面名(双) -- 整个html的页面名字,相当于一本书的书名 <title>北门吹雪</ti ...
- Git的基本原理与常用命令[二]
标签(linux): git 笔者Q:972581034 交流群:605799367.有任何疑问可与笔者或加群交流 git 的四个区域 四种状态 常用命令 git add #加入暂存(索引区) git ...
- Eclipse启动报错[ out of memory error has occurred ]或[ An internal error occurred while showing an internal error ]
自我总结,有什么需要纠正或更好的方案,请告知,谢谢! 最近上来看到好多同学都遇到了这个问题,之前我也好几次碰到这个问题,很是恼火,什么没干,eclipse一开电脑就卡死了,后来发现不管是新打开ecli ...