R语言 典型相关分析
1、关键点
#典型相关分析#
#典型相关分析是用于分析两组随机变量之间的相关程度的一种统计方法,它能够有效地揭示两组随机变量之间的相互(线性依赖)关系
#例如 研究生入学考试成绩与本科阶段一些主要课程成绩的相关性
#将研究两组变量的相关性问题转化为研究两个变量的相关性问题 此类相关为典型相关#
#总体典型相关
#样本典型相关
#典型相关计算 cancor(x,y,xcenter=TRUE,ycenter=TRUE)
#x,y是相应的数据矩阵 xcenter,ycenter是逻辑变量 TRUE是将数据中心化 FALSE是不中心化
2、典型相关分析的简单步骤:
#1.载入原始数据
#2.原始数据标准化 scale
#3.典型相关分析
3、案例分析
#现对20名中年人测得三个生理指标:体重(X1) 腰围(X2) 脉搏(X3)
#三个训练指标:引体向上(Y1) 起座次数(Y2) 跳跃次数(Y3) 试分析这组数据的相关性
#用数据框的形式输入数据
test<-data.frame(
X1=c(, , , , , , , , , ,
, , , , , , , , , ),
X2=c(, , , , , , , , , ,
, , , , , , , , , ),
X3=c(, , , , , , , , , ,
, , , , , , , , , ),
Y1=c( , , , , , , , , , ,
, , , , , , , , , ),
Y2=c(, , , , , , , , , ,
, , , , , , , , , ),
Y3=c(, , , , , , , , , ,
, , , , , , , , , )
)
#为了消除数量级的影响 将数据标准化处理 调用scale函数
test<-scale(test)
#对标准化的数据做典型相关分析
ca<-cancor(test[,:],test[,:])
#查看分析结果
ca
#计算数据在典型变量下的得分 U=AX V=BY
U<-as.matrix(test[, :])%*% ca$xcoef
V<-as.matrix(test[, :])%*% ca$ycoef
#画出U1、V1和U3、V3为组表的数据散点图
plot(U[,], V[,], xlab="U1", ylab="V1")
plot(U[,], V[,], xlab="U3", ylab="V3"
由散点图可知 第一典型相关变量分布在一条直线附近 ;第三典型相关变量数据很分散。
#典型相关系数的显著性检验
#作为相关分析的目的 就是选择多少对典型变量?因此需要做典型相关系数的显著性检验
#若认为相关系数k为0 就没有必要考虑第k对典型变量了
#相关系数检验R程序
source("E:/R/corcoef.test.R")
corcoef.test(r=ca$cor,n=,p=,q=)
最终程序运行结果显示选择第一对典型相关变量。
orcoef.test<-function(r, n, p, q, alpha=0.1){
#r为相关系数 n为样本个数 且n>p+q
m<-length(r); Q<-rep(, m); lambda <-
for (k in m:){
lambda<-lambda*(-r[k]^); #检验统计量
Q[k]<- -log(lambda) #检验统计量取对数
}
s<-; i<-m
for (k in :m){
Q[k]<- (n-k+-/*(p+q+)+s)*Q[k] #统计量
chi<--pchisq(Q[k], (p-k+)*(q-k+))
if (chi>alpha){
i<-k-; break
}
s<-s+/r[k]^
}
i #显示输出结果 选用第几对典型变量
}
典型相关系数检验 R语言程序 corcoef.test.R 将其保存在计算机的E盘的R文件夹下
R语言 典型相关分析的更多相关文章
- R语言中文社区历史文章整理(类型篇)
R语言中文社区历史文章整理(类型篇) R包: R语言交互式绘制杭州市地图:leafletCN包简介 clickpaste包介绍 igraph包快速上手 jiebaR,从入门到喜欢 Catterpl ...
- R语言︱情感分析—词典型代码实践(最基础)(一)
每每以为攀得众山小,可.每每又切实来到起点,大牛们,缓缓脚步来俺笔记葩分享一下吧,please~ --------------------------- 笔者寄语:词典型情感分析对词典要求极高,词典中 ...
- R语言︱词典型情感分析文本操作技巧汇总(打标签、词典与数据匹配等)
每每以为攀得众山小,可.每每又切实来到起点,大牛们,缓缓脚步来俺笔记葩分享一下吧,please~ --------------------------- 笔者寄语:情感分析中对文本处理的数据的小技巧要 ...
- R语言重要数据集分析研究——需要整理分析阐明理念
1.R语言重要数据集分析研究需要整理分析阐明理念? 上一节讲了R语言作图,本节来讲讲当你拿到一个数据集的时候如何下手分析,数据分析的第一步,探索性数据分析. 统计量,即统计学里面关注的数据集的几个指标 ...
- R语言函数总结(转)
R语言特征 对大小写敏感 通常,数字,字母,. 和 _都是允许的(在一些国家还包括重音字母).不过,一个命名必须以 . 或者字母开头,并且如果以 . 开头,第二个字符不允许是数字. 基本命令要么是表达 ...
- 【R笔记】R语言函数总结
R语言与数据挖掘:公式:数据:方法 R语言特征 对大小写敏感 通常,数字,字母,. 和 _都是允许的(在一些国家还包括重音字母).不过,一个命名必须以 . 或者字母开头,并且如果以 . 开头,第二个字 ...
- R语言笔记完整版
[R笔记]R语言函数总结 R语言与数据挖掘:公式:数据:方法 R语言特征 对大小写敏感 通常,数字,字母,. 和 _都是允许的(在一些国家还包括重音字母).不过,一个命名必须以 . 或者字母开头, ...
- 【转】R语言函数总结
原博: R语言与数据挖掘:公式:数据:方法 R语言特征 对大小写敏感 通常,数字,字母,. 和 _都是允许的(在一些国家还包括重音字母).不过,一个命名必须以 . 或者字母开头,并且如果以 . 开头, ...
- 典型相关分析CCA计算过程
本文介绍了CCA解决的问题,CCA原理的推导过程,以及对计算结果物理意义的解释.并且通过SPSS和R操作演示了一个关于CCA的例子.数据文件下载参考[8],SPSS输出结果文件下载参考[9],R代 ...
随机推荐
- 【bzoj1212】 [HNOI2004]L语言
题目描述 标点符号的出现晚于文字的出现,所以以前的语言都是没有标点的.现在你要处理的就是一段没有标点的文章. 一段文章T是由若干小写字母构成.一个单词W也是由若干小写字母构成.一个字典D是若干个单词的 ...
- SQL删除重复行和查询所有大于某成绩的语句分析
有这样一个题,用一条SQL语句 查询出每门课都大于80分的学生姓名. 下面是表 分析,查询每门课程都大于80的学生.SELECT DISTINCT name FROM dbo.student WHER ...
- Tomcat-java.lang.NoClassDefFoundError: org/apache/juli/logging/LogFactory
好些天没弄java了,今天开MyEclipse,发现启动Tomcat的时候发错了,后来发现,报错如题. 解决方案是将 bin/tomcat-juli.jar 添加到add tomcat classpa ...
- 分享red hat linux 6上安装oracle11g时遇到的gcc: error trying to exec 'cc1': execvp: No such file or directory的问题处理过程
安装环境:Red Hat Linux 6.5_x64.oracle11g 64bit 报错详情: 安装到68%时弹窗报错: 调用makefile '/test/app/Administrators/p ...
- Js--AJAX的小知识(一):ajax的五种状态
一.ajax的五种状态(readyState ) 0 - (未初始化)还没有调用send()方法 1 - (载入)已调用send()方法,正在发送请求 2 - (载入完成)send()方法执行完成,已 ...
- MyBatis的学习总结六:Mybatis的缓存【参考】
一.Mybatis缓存介绍 正如大多数持久层框架一样,Mybatis同样提供了一级缓存和二级缓存 1.一级缓存:基于PerpetualCache的HashMap本地缓存,其存储作用域为Session, ...
- 线性回顾-generalize issue
Ein的平均,Eout的平均 用这个平均来justify linear regresssion能够用的很好 noise level 资料里有多少的杂讯 等一下要证明的事情 predictions + ...
- 生成dll文件的示例
看了好多网上写的关于dll文件生成和实用的资料发现多尔不全,都是抄来抄去,有的干脆就是搬用msdn上的原文,实在没有创意和可看的东西.于是本着学和实用的目的自己实践的东西分享给大家. 大前提:使用VS ...
- windows phone 之手势识别(Manipulation)
在Windows Phone 7的多触摸屏上可以检测到至少四根同时存在的手指,并且一起操作使触摸屏充分发挥效果. 在silverlight开发中通过事件来实现触屏事件的检测,包括低级别的和高级别的接口 ...
- 【实习记】2014-08-24实习生无法映射磁盘替代方案rsync+非默认端口22设置
正职开发人员有两个电脑,一个办公网的,一个开发网的.通过samba服务在开发网机器上映射编译环境机的磁盘没有问题. 开发岗实习生使用虚拟机做跳板方式登录编译环境机.上面的方法不能用. 替代方法:rsy ...