主成分方差解释率计算

通常，求得了PCA降维后的特征值，我们就可以绘图，但各个维度的方差解释率没有得到，就无法获得PC坐标的百分比。

有些工具的结果是提供了维度标准差的，如ggbiplot绘图时，直接会给你算出各个坐标的方差解释率。但我觉得这类工具绘图远不如ggplot本身，此时，就需要自己计算。

当理解了PCA的原理和含义后，就比较容易得到。网上一大堆，这里不介绍。

以ggbiplot数据为例，并将算出结果与之比较。

if(!require(devtools))

  install.packages("devtools")

library(devtools)

if(!require(ggbiplot))

  install_github("vqv/ggbiplot")

library(ggbiplot)

data(wine)

pca <- prcomp(wine, scale. = TRUE)

ggbiplot(pca,

         # groups = wine.class,

         ellipse = TRUE, circle = TRUE,

         obs.scale = 1, var.scale = 1) +

  scale_color_discrete(name = '') +

  theme(legend.direction = 'horizontal', legend.position = 'top')

R自带函数prcomp的结果中得到PCA的5个对象结果，其中包含了标准差（sdev）和特征向量（x）。

> str(pca)

List of 5

 $ sdev    : num [1:13] 2.169 1.58 1.203 0.959 0.924 ...

 $ rotation: num [1:13, 1:13] -0.14433 0.24519 0.00205 0.23932 -0.14199 ...

  ..- attr(*, "dimnames")=List of 2

  .. ..$ : chr [1:13] "Alcohol" "MalicAcid" "Ash" "AlcAsh" ...

  .. ..$ : chr [1:13] "PC1" "PC2" "PC3" "PC4" ...

 $ center  : Named num [1:13] 13 2.34 2.37 19.49 99.74 ...

  ..- attr(*, "names")= chr [1:13] "Alcohol" "MalicAcid" "Ash" "AlcAsh" ...

 $ scale   : Named num [1:13] 0.812 1.117 0.274 3.34 14.282 ...

  ..- attr(*, "names")= chr [1:13] "Alcohol" "MalicAcid" "Ash" "AlcAsh" ...

 $ x       : num [1:178, 1:13] -3.31 -2.2 -2.51 -3.75 -1.01 ...

  ..- attr(*, "dimnames")=List of 2

  .. ..$ : NULL

  .. ..$ : chr [1:13] "PC1" "PC2" "PC3" "PC4" ...

 - attr(*, "class")= chr "prcomp"

手动计算方差解释率：

> pca$sdev^2/sum(pca$sdev^2)*100

#注意平方

 [1] 36.1988481 19.2074903 11.1236305  7.0690302  6.5632937  4.9358233

 [7]  4.2386793  2.6807489  2.2221534  1.9300191  1.7368357  1.2982326

[13]  0.7952149

可看出，前两个主成分与图中一致。当然如果没有标准差结果，我们也可以根据特征向量计算出来：

> sdev<- apply(pca$x,2,sd)

> sdev

      PC1       PC2       PC3       PC4       PC5       PC6       PC7

2.1692972 1.5801816 1.2025273 0.9586313 0.9237035 0.8010350 0.7423128

      PC8       PC9      PC10      PC11      PC12      PC13

0.5903367 0.5374755 0.5009017 0.4751722 0.4108165 0.3215244

绘图示例

一个示例，可在此基础上进一步优化。如样本要再分组，可加shape。

ggplot(data=data.frame(pca$x), aes(PC1,PC2)) +

  stat_ellipse(aes(fill=wine.class),type="norm",geom="polygon",alpha=0.2,color=NA)+

  geom_point(size=2)+

  # scale_size(guide=FALSE)+

  scale_color_manual(values = col)+

  geom_vline(xintercept = 0,linetype="dotted")+

  geom_hline(yintercept = 0,linetype="dotted")+

  labs(x=paste0("PC1", sprintf("(%0.2f%%)",100*pca$sdev[1]^2/sum(pca$sdev^2))),

       y=paste0("PC2", sprintf("(%0.2f%%)",100*pca$sdev[2]^2/sum(pca$sdev^2))))

https://www.jianshu.com/p/39d22980dd61

PCA方差解释比例求解与绘图？的更多相关文章

PCA降维-最大，最小方差解释
转自http://www.cnblogs.com/jerrylead/archive/2011/04/18/2020209.html http://www.cnblogs.com/jerrylead/ ...
主成分分析（Principal components analysis）-最大方差解释
原文:http://www.cnblogs.com/jerrylead/archive/2011/04/18/2020209.html 在这一篇之前的内容是<Factor Analysis> ...
<转>主成分分析（Principal components analysis）-最大方差解释,最小平方差解释
转自http://www.cnblogs.com/jerrylead/archive/2011/04/18/2020209.html http://www.cnblogs.com/jerrylead/ ...
ng机器学习视频笔记（二） ——梯度下降算法解释以及求解θ
ng机器学习视频笔记(二) --梯度下降算法解释以及求解θ (转载请附上本文链接--linhxx) 一.解释梯度算法梯度算法公式以及简化的代价函数图,如上图所示. 1)偏导数由上图可知,在a点 ...
PCA原理解释
上图讲述的两组数据,可以看到左图的数据离散度比较大,相关性比较弱,右图数据的相关性比较强:我们在使用PCA的时候,就是要将相关性强的数据进行降维,以减少处理的数据量. 那么怎么描述数据的相关性呢? ...
PCA原理解释（二）
PCA在做数据处理,一般会有一个数据预处理,其中一个目标就是将取数据特征向相关性. 为什么要去特征的相关性? 因为数据如果有相关性,在学习的时候是冗余的,徒增学习成本:所以对于数据处理(也称之为白化, ...
PCA算法的最小平方误差解释
PCA算法另外一种理解角度是:最小化点到投影后点的距离平方和. 假设我们有m个样本点,且都位于n维空间中,而我们要把原n维空间中的样本点投影到k维子空间W中去(k<n),并使得这m个点到投影点 ...
机器学习：PCA（高维数据映射为低维数据封装&调用）
一.基础理解 1) PCA 降维的基本原理寻找另外一个坐标系,新坐标系中的坐标轴以此表示原来样本的重要程度,也就是主成分:取出前 k 个主成分,将数据映射到这 k 个坐标轴上,获得一个低维的数据集. ...
群体结构图形三剑客——PCA图
重测序便宜了,群体的测序和分析也多了起来.群体结构分析,是重测序最常见的分析内容.群体结构分析应用十分广泛,首先其本身是群体进化关系分析里面最基础的分析内容,其次在进行GWAS分析的时候,本身也需要使 ...

随机推荐

5.27日Scrum Metting
日期:2021年5月27日会议主要内容概述:确定账单数据格式,确定需要添加新的图表,确定模板分享功能任务量. 一.进度情况# 组员负责两日内已完成的工作后两日计划完成的工作工作中遇到的困难 ...
Python 模块feedparser安装使用
RSS(简易信息聚合) 简易信息聚合(也叫聚合内容)是一种RSS基于XML标准,在互联网上被广泛采用的内容包装和投递协议.RSS(Really Simple Syndication)是一种描述和同步网 ...
populating-next-right-pointers-in-each-node leetcode C++
Given a binary tree struct TreeLinkNode { TreeLinkNode *left; TreeLinkNode *right; TreeLinkNode *nex ...
axios & fetch 异步请求
// 一.创建实例 const request = axios.create({ baseURL: "http://kg.zhaodashen.cn/v2", headers: { ...
Nessus home版插件更新
1,进入服务器停止服务 service nessusd stop 2,进入目录执行命令获取Challenge code cd /opt/nessus/sbin/ ./nessuscli fetch - ...
telnet IP 端口的作用
测试远程服务器的端口是否开启
prometheus（3）之grafan可视化展现
可视化UI界面Grafana的安装和配置 Grafana介绍 Grafana是一个跨平台的开源的度量分析和可视化工具,可以将采集的数据可视化的展示,并及时通知给告警接收方.它主要有以下六大特点: 1. ...
Django开发 X-Frame-Options to deny 报错处理
本博客已停更,请转自新博客查看 https://www.whbwiki.com/318.html 错误提示 Refused to display 'http://127.0.0.1:8000/inde ...
菜鸡的Java笔记第三十三 - java 泛型
泛型 GenericParadigm 1.泛型的产生动机 2.泛型的使用以及通配符 3.泛型方法的使用 JDK1.5 后的三大主 ...
C#中指针的使用（转）
在C#中,有时候希望通过指针来操作内存,这样可以提高效率.我们可以用unsafe关键字修饰含有指针操作的程序段,如下所示: class Program { static int Main(stri ...

PCA方差解释比例求解与绘图？

主成分方差解释率计算

绘图示例

PCA方差解释比例求解与绘图？的更多相关文章

随机推荐

热门专题