PCA简介：

从n维数据中提取最能代表这组数据的m个向量，也就是对数据进行降维（n->m），提取特征。

目标：

找到一个向量\(\mu\)，使n个点在其上的投影的方差最大（投影后的数据越不集中，就说明每个向量彼此之间包含的相似信息越少，从而实现数据降维）

前提假设：

总的数据：

\[A = (x_1, x_2, \cdots , x_n)\]

\(X\)的协方差：

\[C = Cov(X) = \frac{1}{n}\sum_{i=1}^n(x_i-\overline{x})(x_i-\overline{x})^T\]

向量\(\mu\)：

\[|\mu| = 1 \Rightarrow \mu^T\mu = 1\]

证明：

易知\(x_i\)在\(\mu\)上的投影为\[(x_i-\overline{x})^T\mu\]

因为\((x_i-\overline{x})\)均值为0，所以记其方差\(J\)为

\[\frac{1}{n}\sum_{i=1}^n((x_i-\overline{x})^T\mu)^2\]

又因为上式平方项中为标量，故可以将\(J\)改写为

\[\frac{1}{n}\sum_{i=1}^n((x_i-\overline{x})^T\mu)^T((x_i-\overline{x})^T\mu)\]

化简，得

\[\frac{1}{n}\sum_{i=1}^n\mu^T(x_i-\overline{x})(x_i-\overline{x})^T\mu\]

发现中间两项是协方差，带入，得

\[\mu^TC\mu\]

接下来就是一个在给定约束条件\(\mu^T\mu\) = 1，下的最优化问题，这里使用Lagrange乘数法求解

构造Lagrange函数\[L(\mu, C, \lambda) = \mu^TC\mu + \lambda(1-\mu^T\mu)\]

关于\(\mu\)求偏导，得

\[\frac{\partial J}{\partial \mu} = 2C\mu - 2\lambda\mu\]

令其等于0，得

\[C\mu = \lambda\mu\]

是不是有点眼熟？
没错，\(\lambda\)就是\(C\)的特征值（eigen-value），\(\mu\)就是\(C\)的特征向量（eigen-vector）
因此，这个我们要求的向量\(\mu\)就是\(C\)的特征向量（要m个，就取前m个最大的特征值对应的特征向量）

PCA主成分分析（最大投影方差）的更多相关文章

【建模应用】PCA主成分分析原理详解
原文载于此:http://blog.csdn.net/zhongkelee/article/details/44064401 一.PCA简介 1. 相关背景上完陈恩红老师的<机器学习与知识发现 ...
机器学习之PCA主成分分析
前言以下内容是个人学习之后的感悟,转载请注明出处~ 简介在用统计分析方法研究多变量的课题时,变量个数太多就会增加课题的复杂性.人们自然希望变量个数较少而得到的信息较多.在很 ...
PCA主成分分析Python实现
作者:拾毅者出处:http://blog.csdn.net/Dream_angel_Z/article/details/50760130 Github源代码:https://github.com/c ...
PCA(主成分分析)方法浅析
PCA(主成分分析)方法浅析降维.数据压缩找到数据中最重要的方向:方差最大的方向,也就是样本间差距最显著的方向在与第一个正交的超平面上找最合适的第二个方向 PCA算法流程上图第一步描述不正确, ...
PCA主成分分析（上）
PCA主成分分析 PCA目的最大可分性(最大投影方差) 投影优化目标关键点推导为什么要找最大特征值对应的特征向量呢? 之前看3DMM的论文的看到其用了PCA的方法,一开始以为自己对于PCA已 ...
PCA 主成分分析（Principal components analysis ）
问题 1. 比如拿到一个汽车的样本,里面既有以“千米/每小时”度量的最大速度特征,也有“英里/小时”的最大速度特征,显然这两个特征有一个多余. 2. 拿到一个数学系的本科生期末考试成绩单,里面有三列, ...
特征脸(Eigenface)理论基础-PCA(主成分分析法)
在之前的博客人脸识别经典算法一:特征脸方法(Eigenface) 里面介绍了特征脸方法的原理,但是并没有对它用到的理论基础PCA做介绍,现在做补充.请将这两篇博文结合起来阅读.以下内容大部分参考 ...
用PCA(主成分分析法)进行信号滤波
用PCA(主成分分析法)进行信号滤波此文章从我之前的C博客上导入,代码什么的可以参考matlab官方帮助文档现在网上大多是通过PCA对数据进行降维,其实PCA还有一个用处就是可以进行信号滤波.网上 ...
PCA(主成分分析)的简单理解
PCA(Principal Components Analysis),它是一种“投影(projection)技巧”,就是把高维空间上的数据映射到低维空间.比如三维空间的一个球,往坐标轴方向投影,变成了 ...
『科学计算_理论』PCA主成分分析
数据降维为了说明什么是数据的主成分,先从数据降维说起.数据降维是怎么回事儿?假设三维空间中有一系列点,这些点分布在一个过原点的斜面上,如果你用自然坐标系x,y,z这三个轴来表示这组数据的话,需要使用 ...

随机推荐

深入浅出Spring（三）
我为大家简单介绍了一下Spring框架核心内容中的IoC,接下来我们继续讲解另一个核心AOP(Aspect Oriented Programming),即面向切面编程. 1.OOP回顾在介绍AOP之 ...
mysql插入的时间莫名的加一秒
1.问题描述我获取当天最大的时间: public static Date getEndOfDay(Date date) { LocalDateTime localDateTime = LocalDa ...
【C/C++】之C/C++快速入门
1 基本数据类型 C/C++语言中的基本数据类型及其属性如下表所示: 类型取值范围大致范围整形 int -2147483648 ~ +2147483647 (即-231 ~ +(231-1 ...
java8 按两个属性分组，并返回扁平List； stream排序
--------------- java8 按两个属性分组,并返回扁平List /** * 设置大区小区分组排序 * @param dtoList */ private List<Perform ...
2019-2020-1 20199304《Linux内核原理与分析》第五周作业
第四章系统调用的三层机制(上) 4.1 用户态.内核态和中断知识点总结: 与系统调用打交道的方式是通过库函数的方式. 用户态与内核态的区分内核态:高的执行级别下,代码可以执行特权指令,访问任意的 ...
TensorFlow2.0（11）：tf.keras建模三部曲
.caret, .dropup > .btn > .caret { border-top-color: #000 !important; } .label { border: 1px so ...
segment树(线段树)
线段树(segment tree)是一种Binary Search Tree或者叫做ordered binary tree.对于线段树中的每一个非叶子节点[a,b],它的左子树表示的区间为[a,(a+ ...
hibernate绑定session
session session是一种单实例对象简单说就是自己用别人不能用.在一些项目中很多人一起来操作所以我们可以把session与我们的本地线程一起绑定,本地线程的特点就是执行一次从创建到销 ...
基于jquery的弹幕实现
前几天,需要做一个弹幕展示效果,看了网上很多资料,但是很不凑巧,都不能满足自己的需求和功能点,但是总不能放弃吧,那么就自己写一个,今天把成果分享给大家,首先说一下市面上比较流行的弹幕插件吧: 1.有关 ...
移动开发在路上-- IOS移动开发系列网络交互四（1）
最近一段时间上班忙的没日没夜的,不是披星戴月,就是头天早上出门,第二天早上回家...一直没出处时间来更新博客,码农之苦,说了都是泪,废话不多说,直接本主题,经过之前三篇的讲述,ios开发的东西大家或多 ...

PCA主成分分析（最大投影方差）

PCA简介：

目标：

前提假设：

证明：

PCA主成分分析（最大投影方差）的更多相关文章

随机推荐

热门专题