1. 矩阵相关性计算方法

base::cor/cor.test

R基础函数cor或cor.test都可计算相关性系数，但cor可直接计算矩阵的相关性，而cor.test不可。

两者计算非矩阵时，cor仅得到相关系数，而cor.test还能得到pvalue。

library(ggplot2)

cor(mtcars)

cor.test(mtcars) #error

cor.test(mtcars,mtcars) #error

cor(mtcars$mpg,mtcars$cyl) #only cor

x=cor.test(mtcars$mpg,mtcars$cyl) #cor and pvalue

x$estimate

x$p.value

可以用基础函数cor得到相关性矩阵，再自己编写脚本获得pvalue矩阵。

M = cor(mtcars)

#自编写函数得到pvalue矩阵

cor.mtest <- function(mat, ...) {

  mat <- as.matrix(mat)

  n <- ncol(mat)

  p.mat<- matrix(NA, n, n)

  diag(p.mat) <- 0

  for (i in 1:(n - 1)) {

    for (j in (i + 1):n) {

      tmp <- cor.test(mat[, i], mat[, j], ...)

      p.mat[i, j] <- p.mat[j, i] <- tmp$p.value

    }

  }

  colnames(p.mat) <- rownames(p.mat) <- colnames(mat)

  p.mat

}

matrix_p=cor.mtest(mtcars)

psych::corr.test

使用psych包中的corr.test函数，可直接获得矩阵相关性系数和pvalue（也可用于非矩阵），而且还可直接得到矫正后的pvalue。

library(psych)

corr.test(mtcars)

cor <- corr.test(mtcars,

                 method = "pearson",

                 adjust = "fdr") #同p.adjust函数

cor$r

cor$p

cor$p.adj #但得到的是向量，数目也不对

test <- p.adjust(cor$p,method = "fdr")

identical(cor$p.adj,test) #不等

Hmisc::rcorr

使用Hmisc包中的rcorr函数，直接得到相关性系数和pvalue矩阵。

library(Hmisc)

#注意要将数据框转换为矩阵

cor.mat <- rcorr(as.matrix(mtcars), type = "pearson")

cor.mat$r

cor.mat$P

可视化时，pvalue矩阵对角线的显著性我们不必要展示，可以替换下。另外，如果后续不展示全部矩阵，只展示过了设置条件的部分，则可进行过滤。

# # only keep comparisons that have some abs. correlation >= .5 (optional)

# keep <- rownames(cor.mat$r)[rowSums(abs(cor.mat$r)>=0.5) > 1]

# cor.mat <- lapply(cor.mat, function(x) x[keep, keep])

# set diagonal to 1, since it is not interesting and should not be marked

diag(cor.mat$P) <- 1

其他工具

其他还有工具，如ggcor + ggcorrplot，但不建议使用，增加学习成本，以上方法足以成对所有情况。

另外统计和绘图R包rstatix也可计算相关矩阵，显示和标记显著性水平，而且可以gather和spread相关性矩阵，可tidyverse语法类似。这个包值得好好学习：https://rpkgs.datanovia.com/rstatix/index.html

2. 相关性矩阵转化为两两相关

一般来说，我们得到的是相关性系数矩阵和pvalue矩阵，但输出数据时最好转换为两两之间的行列式格式。

这种转换以上的rstatix包可轻松解决。

请参考：https://rpkgs.datanovia.com/rstatix/reference/cor_reshape.html

另外，我们也可自己编写脚本得到：

flattenCorrMatrix <- function(cormat, pmat) {

  ut <- upper.tri(cormat)

  data.frame(

    row = rownames(cormat)[row(cormat)[ut]],

    column = rownames(cormat)[col(cormat)[ut]],

    cor  =(cormat)[ut],

    p = pmat[ut]

  )

}

res <- flattenCorrMatrix(cor.mat$r, cor.mat$P)

res

3. 可视化

得到了相关性和pvalue两个矩阵，我们一般以热图展示为好。

corrplot

经典的相关性展示工具。很多可选样式：https://cran.r-project.org/web/packages/corrplot/vignettes/corrplot-intro.html

我仅展示几个案例，更多参数自己调节。

#仅cor

corrplot.mixed(M)

#cor,仅0.05

corrplot.mixed(M,

               insig = 'label_sig',

               p.mat=matrix_p,

               pch.cex = 0.9,

               pch.col = 'grey20')

#细分

corrplot(M,

         p.mat = matrix_p,

         tl.pos = 'd',

         order = 'hclust',

         type = "upper",

         #addrect = 2,

         insig = 'label_sig',

         sig.level = c(0.001, 0.01, 0.05),

         pch.cex = 0.9,

         pch.col = 'grey20')

gplots::heatmap.2

相对于上图，我更喜欢用热图来展示。

library(RColorBrewer)

library(gplots)

my_palette <- colorRampPalette(c("blue","white","red")) (100)

# plot heatmap and mark cells with abs(r) >= .5 and p < 0.05

heatmap.2(cor.mat$r,

          # cexRow = .35, cexCol = .35,

          trace = 'none',

          # key.title = 'Spearman correlation',

          # keysize = .5, key.par = list(cex=.4),

          notecol = 'black', srtCol = 30,

          col = my_palette,

          cellnote = ifelse(cor.mat$P < 0.05 & abs(cor.mat$r)>=0.5, "*", ""))

以上我仅标出相关性绝对值大于0.5，pvalue<0.05的数据。当然可以做更细致划分。

pheatmap

pheatmap参数更好调些，看个人喜好。

#pheatmap

pheatmap(cor.mat$r,

         color = my_palette,

         display_numbers = ifelse(cor.mat$P < 0.05 & abs(cor.mat$r)>=0.5, "*", ""))

Ref:

https://www.jianshu.com/p/b76f09aacd9c

https://chowdera.com/2020/12/20201218185101270B.html

https://stackoverflow.com/questions/66305232/r-how-to-plot-a-heatmap-that-shows-significant-correlations

http://www.sthda.com/english/wiki/correlation-matrix-an-r-function-to-do-all-you-need

http://www.sthda.com/english/wiki/correlation-matrix-a-quick-start-guide-to-analyze-format-and-visualize-a-correlation-matrix-using-r-software

R语言矩阵相关性计算及其可视化？的更多相关文章

R语言做相关性分析
衡量随机变量相关性的方法主要有三种:pearson相关系数,spearman相关系数,kendall相关系数: 1. pearson相关系数,亦即皮尔逊相关系数 pearson相关系数用来 ...
R语言矩阵matrix函数
矩阵是元素布置成二维矩形布局的R对象. 它们包含相同原子类型的元素.尽管我们可以创建只包含字符或只逻辑值的矩阵,但是它们没有多大用处.我们使用的是在数学计算中含有数字元素矩阵. 使用 matrix() ...
R语言的导数计算（转）
转自:http://blog.fens.me/r-math-derivative/ 前言高等数学是每个大学生都要学习的一门数学基础课,同时也可能是考完试后最容易忘记的一门知识.我在学习高数的时候绞尽 ...
R语言矩阵维度“消失”的问题
矩阵(matrix)是R语言中很基础的一种数据结构,也是R语言使用者经常使用的一种数据结构.矩阵的维度一般为二维(m*n). R语言中矩阵的操作是非常简单易懂的,但是在对R语言做矩阵操作时,有个地方需 ...
用数据说话，R语言有哪七种可视化应用？
今天,随着数据量的不断增加,数据可视化成为将数字变成可用的信息的一个重要方式.R语言提供了一系列的已有函数和可调用的库,通过建立可视化的方式进行数据的呈现.在使用技术的方式实现可视化之前,我们可以先和 ...
R语言矩阵
矩阵是元素布置成二维矩形布局的R对象. 它们包含相同原子类型的元素. R创建矩阵的语法: matrix(data, nrow, ncol, byrow, dimnames) 参数说明: data - ...
R 操作矩阵和计算SVD的基本操作记录
在R中可以用函数matrix()来创建一个矩阵,应用该函数时需要输入必要的参数值. > args(matrix) function (data = NA, nrow = 1, ncol = 1, ...
R语言 vegan包计算物种累计曲线
vegan 包是进行群落数据分析最常用的R包,其中的 specaccum 函数用来计算物种的累计曲线首先看下官方示例: library(vegan) data(BCI) sp1 <- spec ...
R语言笔记005——计算描述性统计量
数据的分布特征: 分布的集中趋势,反应各数据向其中心值靠拢或聚集的程度(平均数,中位数,四分位数,众数) 分布的离散程度,反应各数据远离其中心值的趋势(极差,四分位差,方差,标准差,离散系数) 分布的 ...

随机推荐

看动画学算法之:队列queue
目录简介队列的实现队列的数组实现队列的动态数组实现队列的链表实现队列的时间复杂度简介队列Queue是一个非常常见的数据结构,所谓队列就是先进先出的序列结构. 想象一下我们日常的排队买票 ...
BZOJ4919[Lydsy1706月赛]大根堆-------------线段树进阶
是不是每做道线段树进阶都要写个题解..根本不会写 Description 给定一棵n个节点的有根树,编号依次为1到n,其中1号点为根节点.每个点有一个权值v_i. 你需要将这棵树转化成一个大根堆.确切 ...
【BZOJ 1419】Red is good [概率DP]
我是 Z Z 概率好玄啊(好吧是我太弱.jpg Description 桌面上有R张红牌和B张黑牌,随机打乱顺序后放在桌面上,开始一张一张地翻牌,翻到红牌得到1美元,黑牌则付出1美元.可以随时停止翻 ...
文献翻译|Design of True Random Number Generator Based on Multi-stage Feedback Ring Oscillator（基于多级反馈环形振荡器的真随机数发生器设计）
基于多级反馈环形振荡器的真随机数发生器设计摘要真随机数生成器(trng)在加密系统中起着重要的作用.本文提出了一种在现场可编程门阵列(FPGA)上生成真随机数的新方法,该方法以多级反馈环形振荡器 ...
寻找下一个结点牛客网程序员面试金典 C++ java Python
寻找下一个结点牛客网程序员面试金典 C++ java Python 题目描述请设计一个算法,寻找二叉树中指定结点的下一个结点(即中序遍历的后继). 给定树的根结点指针TreeNode* root ...
cm0 逆向分析
目录 cm0 逆向分析前言 Strings工具复习 String工具使用说明 Strings工具解cm0题 cm0 逆向分析前言 Emmmmm,我假装你看到这里已经学过了我的<恶意代码分析实 ...
Language Server for Java™ 1.0 在VS Code上正式发布！
Nick Zhu form Senior Program Manager, Developer Division at Microsoft 今天,我们很高兴与大家宣布:Language Server ...
Oracle ORA 12541 报错解决过程
Oracle 导入全库之后使用plsql登陆时报错版本12C版本2 ORA-12541: TNS: No Listener 再oracle主机本地可以使用sqlplus 登陆,但是使用plsql无法 ...
loadRunner12 设置关联获取服务端动态数据
关联:服务器返回给客户端一些动态变化的值,客户端用这些值去访问服务器,不能把这些值写死在脚本里面,而应该存放在一个变量里面. 在脚本回放过程中,客户端发出请求,通过关联函数所定义的左右边界值(也就是关 ...
pyinstaller设置图标出现“struct.error: unpack requires a buffer of 16 bytes”
pyinstaller设置图标出现"struct.error: unpack requires a buffer of 16 bytes" 直接用png图片改后缀名为ico,然后p ...

R语言矩阵相关性计算及其可视化？