PCA的原理简述
PCA的实质就是要根据样本向量之间的相关性排序,去掉相关性低的信息,也就是冗余的特征信息。
我们都知道噪声信号与待测量的信号之间实际上是没有相关性的,所以我我们利用这个原理就可以将与待测量无关的噪声信号PCA去噪
PCA的原理也就是它的简单的实现过程就是:
首先将样本数据构造成对应的数据矩阵,然后求取该数据矩阵的协方差矩阵,协方差矩阵实际上就是表示随机向量之间的相关性的矩阵,那么为什么协方差矩阵可以表示随机向量之间的相关性呢?
协方差矩阵是怎么求解的呢?我们都知道方差实际上表示的是数据偏离中心的程度,方差越大越偏离中心。那么可以理解协方差表示的是任意两个样本之间的相关程度。
仿照方差的定义:

来度量各个维度偏离其均值的程度,协方差可以这样来定义:

接下来就是求解协方差矩阵的特征值和特征向量,那么关于特征值与特征向量(特征值分解可以得到特征值与特征向量,特征值表示的是这个特征到底有多重要,而特征向量表示这个特征是什么,可以将每一个特征向量理解为一个线性的子空间,我们可以利用这些线性的子空间干很多的事情。不过,特征值分解也有很多的局限,比如说变换的矩阵必须是方阵。https://jingyan.baidu.com/article/3065b3b68c6bb6becff8a488.html),根据特征值对特征向量进行排序就可以得到特征直方图,抽取其中的几个维度的特征向量组成特征矩阵,这个矩阵就是所谓的投影矩阵,然后用投影矩阵对原样本数据做一个转换(即相乘的过程)。这样就得到了提取特征值下的处理数据结果了。
PCA的原理简述的更多相关文章
- 主成分分析(PCA)原理及R语言实现
		
原理: 主成分分析 - stanford 主成分分析法 - 智库 主成分分析(Principal Component Analysis)原理 主成分分析及R语言案例 - 文库 主成分分析法的原理应用及 ...
 - 主成分分析(PCA)原理及R语言实现 | dimension reduction降维
		
如果你的职业定位是数据分析师/计算生物学家,那么不懂PCA.t-SNE的原理就说不过去了吧.跑通软件没什么了不起的,网上那么多教程,copy一下就会.关键是要懂其数学原理,理解算法的假设,适合解决什么 ...
 - 主成分分析(PCA)原理总结
		
主成分分析(Principal components analysis,以下简称PCA)是最重要的降维方法之一.在数据压缩消除冗余和数据噪音消除等领域都有广泛的应用.一般我们提到降维最容易想到的算法就 ...
 - TCP/IP协议工作原理简述
		
TCP/IP协议工作原理简述 // */ // ]]> TCP/IP协议工作原理简述 Table of Contents 1 概要 2 应用层 3 传输层 4 网络层 5 链路层 1 概要 ...
 - ButterKnife的原理简述
		
ButterKnife的原理简述 注解处理器Java5 中叫APT(Annotation Processing Tool),在Java6开始,规范化为 Pluggable Annotation Pro ...
 - Excel阅读模式/聚光灯开发技术序列作品之三  高级自定义任务窗格开发原理简述—— 隐鹤
		
Excel阅读模式/聚光灯开发技术序列作品之三 高级自定义任务窗格开发原理简述—— 隐鹤 1. 引言 Excel任务窗格是一个可以用来存放各种常用命令的侧边窗口(准确的说是一个可以停靠在类名为x ...
 - Excel阅读模式/聚光灯开发技术之二 超级逐步录入提示功能开发原理简述—— 隐鹤  / HelloWorld
		
Excel阅读模式/聚光灯开发技术之二 超级逐步录入提示功能开发原理简述———— 隐鹤 / HelloWorld 1. 引言 自本人第一篇博文“Excel阅读模式/单元格行列指示/聚光灯开发技术要 ...
 - FileCloud 的原理简述&自己搭建文件云
		
FileCloud 的原理简述&自己搭建文件云 copyright(c) by zcy 关于如何使用IIS创建asp服务,请读者自行研究 注:不要忘记添加入站规则 代码的存储: 根目录 fil ...
 - 主成分分析法(PCA)原理和步骤
		
主成分分析法(PCA)原理和步骤 主成分分析(Principal Component Analysis,PCA)是一种多变量统计方法,它是最常用的降维方法之一,通过正交变换将一组可能存在相关性的变量数 ...
 
随机推荐
- VUE- 访问服务器端数据 Vue-resource
			
VUE- 访问服务器端数据 Vue-resource 1. 安装 vue-resource cnpm install vue-resource --save 安装完毕后,在main.js中导入,如下所 ...
 - 操作实践:maven工程查找工程中多余的jar包
			
声明:迁移自本人CSDN博客https://blog.csdn.net/u013365635 版本迭代过程中对jar的依赖可能会产生变化,一些本不必再依赖的jar包可以因为没有清除而依然留在版本的发布 ...
 - (转载)(DescriptionResource	Path	Location	Type The superclass "javax.servlet.http.HttpServlet" was not foun
			
eclipse环境下如何配置tomcat 打开Eclipse,单击"Window"菜单,选择下方的"Preferences". 单击"Server&q ...
 - JOIN US | 京东云诚聘技术精英
			
清新的办公区域感受自然的气息,温馨的团队为你我放飞青春的理想 上有天文下有地理的阅读区域 各类图书提供借阅 绿植环绕生机勃勃的会客区域洋溢青春 [高级Java工程师] 职位描述: 参与云计算相关平台/ ...
 - paddle(一)
			
一.概述 一个机器学习的框架,提供了深度学习需要的神经网络,激活函数等主要功能. 基础概念 Program 一次模型训练就是一个program,通过执行器执行,默认环境下是执行fluid.defaul ...
 - Android  公告新闻消息资讯之垂直滚动效果
			
垂直滚动新闻栏的实现原理: 就是一个自定义的LinearLayout,并且textView能够循环垂直滚动,而且条目可以点击,显示区域最多显示2个条目,并且还有交替的属性垂直移动的动画效果,通过线程来 ...
 - 91.一次性处理多条数据的方法:bulk_create,update,delete
			
(1)bulk_create: 可以一次性的创建多个对象 示例代码如下: from django.http import HttpResponse from .models import Pulish ...
 - Codeforce 370C Mittens 巧妙数学题
			
这道题目我一开始想错了,觉得只要排好序,再从头到尾把可以相互交换的进行下交换就可以了...事实证明是错的.正确的解法比较巧妙,而且写法非常好,值得学习 首先,要注意的一个规律是,假如最大的颜色数字出现 ...
 - EXCEL快速实现下拉计算快捷键
			
ctrl + shift + 方向键,,选择要填充的范围,,然后ctrl + d
 - Jupyer Notebook, Jupyter Lab 虚拟环境配置
			
虚拟环境 conda create -n python36 python=3.6 使用以下命令激活: activate python36 Notebook 安装插件 conda install nb_ ...