K-L变换和主成分分析PCA

一.K-L变换

说PCA的话，必须先介绍一下K-L变换了。

K-L变换是Karhunen-Loeve变换的简称，是一种特殊的正交变换。它是建立在统计特性基础上的一种变换，有的文献也称其为霍特林（Hotelling）变换，因为他在1933年最先给出将离散信号变换成一串不相关系数的方法。
K-L变换的突出优点是它能去相关性，而且是均方误差（Mean Square Error，MSE）意义下的最佳变换。

下面就简单的介绍一下K-L变换了。

设，随机向量X ∈Rⁿ(n阶列向量)，它的均值向量为m_X，则其协方差矩阵可以表示为

C_x= E{(X-m_x)*(X-m_x)^T}                           （2.1）

C_x是一个n*n阶的实对称阵。

K-L变换定义了一正交变换A ∈R^n*n，将X ∈Rⁿ的向量映射到用Y ∈Rⁿ代表的向量，并且使Y向量中各分量间不相关：
Y = A*(X-m_x)                                            （2.2）

因为Y的各分量间不相关，则其协方差矩阵C_y为对角阵，即

C_y = diag(λ₁,λ₂,...,λ_n)

而矩阵A总是可以找到的，因为对于实对称阵，总能找到一个正交阵A，使得AC_xA^T的运算结果为对称阵。K-L变换中，将A的每一行取为C_x的特征向量，并且将这些特征向量按对应的特征值大小进行降序排序，使最大特征值对应的特征向量在A的第一行，而最小特征值对应的特征向量在A的最后一行。而C_y是C_x对角化后的结果，所以两个矩阵的特征值是一致的（λ₁,λ₂,...,λ_n）。

这样就可以通过矩阵A实现由随机向量X到随机向量Y的K-L变换了，而由

X = A^TY +m_x （2.3）

就可以实现Y反变换到X。
若选择的最大k个特征值对应的k个特征向量，组成k×n的转换矩阵A，则变换后Y降为k维的，则由Y对X的恢复公式如下：

X‘ = A^KY +m_x   （2.4）

这时候C_y = diag(λ₁,λ₂,...,λ_k)，X与X’之间的均方误差可以由下式表达：

λ_k+1+.λ_k+2...+λ_n                                       （2.5）                            （没有公式编辑器啊）

上面我们提到了对于特征值λ是从大到小排序的，那么这时候通过式子2.5可以表明通过选择k个具有最大特征值的特征向量来降低误差。因此，从可以将向量X和它的近似X‘之间的均方误差降至最小这方面来说，K-L变换是最佳变换。

二.PCA，主成分分析

在二十世纪九十年代初，Kirby和Sirovich开始讨论利用PCA技术进行人脸图像的最优表示问题。并且由M.Turk和A.Pentland将此技术用于人脸识别中，并称为特征脸方法。M.Turk和A.Pentland将m×n的人脸图像，重新排列为m *n维的列向量。则所有的训练图像经此变换后得到一组列向量：{ x_i }，x_i∈R^m*n，其中N代表训练样本集中图像的个数。将图像看成一随机列向量，并通过训练样本对其均值向量和协方差矩阵进行估计。

均值向量μ通过下式估计：
μ = (1/N)*((x₁+x₂+...+x_N)                        （3.1）
协方差矩阵

S_T= E{(x_i-u)*(x_i-u)^T} = X'X'^T               （3.2）

其中X’ = [x₁-μ, x₂-μ,...., x_N-μ]

则将投影变换矩阵A取为ST的前k个最大特征值对应的特征向量。利用K-L变换式对原图像进行去相关并降维：

Y = A_K*(X-m_x)                                          （3.3）

因为S_T=X'X'^T，而X‘为（m*n）*N矩阵，但是因为X’为N阶矩阵，所以S_T的秩最大为N-1，这样只要计算出S_T的特征向量就可以计算出K-L变换矩阵了。

但是因为S_T是（m*n）*(m*n)阶的矩阵，所以计算它的特征向量比较复杂，这里使用了一个技巧：

X^TXv_i=δ_iv_i                                                （3.4）

(XX^T)(Xv_i)=δ_i(Xv_i)                                    （3.5）

根据式子3.4与3.5可以看出，只要计算出X^TX的特征值和特征向量δ_i与v_i，然后就可以计算出XX^T的特征值和特征向量δ_i与Xv_i，而X^TX为N*N阶的矩阵，计算起来比较容易，除此以外，也可以使用SVD，这里就不提了。

三.PCA流程整理

PCA的整个变换过程整理了一下，如下：

1.将mxn的训练图像重新排列为m *n维的列向量。计算均值向量，并利用均值向量将所有样本中心化。
2.利用中心化后的样本向量，根据式（3.2）计算其协方差矩阵；对其特征值分解，并将特征向量按其对应的特征值大小进行降序排列。
3.选取第2步所得的k ≤N-1个最大特征值对应的特征向量组成投影矩阵A，将每幅已中心化的训练图像(x₁-μ, x₂-μ,...., x_N-μ)，向矩阵A投影，得到每幅训练图像的降维表示为(y₁-μ, y₂-μ,...., y_N)
4.对测试图像中心化，并投影到矩阵A，得到测试图像的降维表示。
5.选择合适的分类器，对测试图像进行分类。

reference：主成分分析PCA（Principal Component Analysis）介绍

PCA本质和SVD

K-L变换和主成分分析PCA的更多相关文章

机器学习 —— 基础整理（四）特征提取之线性方法：主成分分析PCA、独立成分分析ICA、线性判别分析LDA
本文简单整理了以下内容: (一)维数灾难 (二)特征提取--线性方法 1. 主成分分析PCA 2. 独立成分分析ICA 3. 线性判别分析LDA (一)维数灾难(Curse of dimensiona ...
主成分分析PCA数据降维原理及python应用（葡萄酒案例分析）
目录主成分分析(PCA)——以葡萄酒数据集分类为例 1.认识PCA (1)简介 (2)方法步骤 2.提取主成分 3.主成分方差可视化 4.特征变换 5.数据分类结果 6.完整代码总结: 1.认识P ...
降维（一）----说说主成分分析(PCA)的源头
降维(一)----说说主成分分析(PCA)的源头降维系列: 降维(一)----说说主成分分析(PCA)的源头降维(二)----Laplacian Eigenmaps --------------- ...
机器学习课程-第8周-降维(Dimensionality Reduction)—主成分分析(PCA)
1. 动机一:数据压缩第二种类型的无监督学习问题,称为降维.有几个不同的的原因使你可能想要做降维.一是数据压缩,数据压缩不仅允许我们压缩数据,因而使用较少的计算机内存或磁盘空间,但它也让我们加快 ...
05-03 主成分分析(PCA)
目录主成分分析(PCA) 一.维数灾难和降维二.主成分分析学习目标三.主成分分析详解 3.1 主成分分析两个条件 3.2 基于最近重构性推导PCA 3.2.1 主成分分析目标函数 3.2.2 主 ...
机器学习降维方法概括， LASSO参数缩减、主成分分析PCA、小波分析、线性判别LDA、拉普拉斯映射、深度学习SparseAutoEncoder、矩阵奇异值分解SVD、LLE局部线性嵌入、Isomap等距映射
机器学习降维方法概括版权声明:本文为博主原创文章,未经博主允许不得转载. https://blog.csdn.net/u014772862/article/details/52335970 最近 ...
深度学习入门教程UFLDL学习实验笔记三：主成分分析PCA与白化whitening
主成分分析与白化是在做深度学习训练时最常见的两种预处理的方法,主成分分析是一种我们用的很多的降维的一种手段,通过PCA降维,我们能够有效的降低数据的维度,加快运算速度.而白化就是为了使得每个特征能有同 ...
线性判别分析（LDA）, 主成分分析(PCA)及其推导【转】
前言: 如果学习分类算法,最好从线性的入手,线性分类器最简单的就是LDA,它可以看做是简化版的SVM,如果想理解SVM这种分类器,那理解LDA就是很有必要的了. 谈到LDA,就不得不谈谈PCA,PCA ...
主成分分析PCA（转载）
主成分分析PCA 降维的必要性 1.多重共线性--预测变量之间相互关联.多重共线性会导致解空间的不稳定,从而可能导致结果的不连贯. 2.高维空间本身具有稀疏性.一维正态分布有68%的值落于正负标准差之 ...

随机推荐

luogu1578 奶牛浴场枚举点最大子矩阵
建议看看王知昆dalao的论文,讲得很好 #include <algorithm> #include <iostream> #include <cstring> # ...
Flask_配置文件
flask中的配置文件是一个flask.config.Config对象(继承字典),默认配置为: default_config = ImmutableDict({ 'DEBUG': get_debug ...
面试问题整理Andorid版本 date: 2017-1-12 21:14:36 categories: 技术
Acitivty的四中启动模式与特点. standard:默认的启动模式 singleTop:适合那种接受通知启动的页面,比如新闻客户端之类的,可能会给你推送好几次 ,但是每次都是打开同一张页面调用o ...
POJ 1690 (Your)((Term)((Project)))
(Your)((Term)((Project))) Time Limit: 1000MS Memory Limit: 10000K Total Submissions: 2912 Accept ...
算法复习——状压dp
状压dp的核心在于,当我们不能通过表现单一的对象的状态来达到dp的最优子结构和无后效性原则时,我们可能保存多个元素的有关信息··这时候利用2进制的01来表示每个元素相关状态并将其压缩成2进制数就可以达 ...
web 工程中利用Spring的 ApplicationContextAware接口自动注入bean
最常用的办法就是用 ClassPathXmlApplicationContext, FileSystemClassPathXmlApplicationContext, FileSystemXmlApp ...
git统计日期之间的代码改动行数
git log --pretty=tformat: --since ==2016-10-25 --until=2016-10-27 --numstat | awk '{ add += $1 ; s ...
hdu 3625 Examining the Rooms 轮换斯特林数
题目大意 n个房间对应n把钥匙每个房间的钥匙随机放在某个房间内,概率相同. 有K次炸门的机会,求能进入所有房间的概率一号门不给你炸分析我们设$key_i$为第i间房里的钥匙是哪把视作房间 ...
bzoj 2300 [HAOI2011]防线修建 set动态维护凸包
题目大意动态删点,求凸包周长分析反过来变成动态加点用set维护平衡树具体是找到凸包上左右两点拆开就可以把左边当作顺时针求的一个凸包,右边当作逆时针求的一个凸包,像栈那样出set就好了注 ...
bzoj 2792 [Poi2012]Well 二分+dp+two_pointer
题目大意给出n个正整数X1,X2,...Xn,可以进行不超过m次操作,每次操作选择一个非零的Xi,并将它减一. 最终要求存在某个k满足Xk=0,并且z=max{|Xi - Xi+1|}最小. 输出最 ...

K-L变换和 主成分分析PCA

一.K-L变换

二.PCA，主成分分析

三.PCA流程整理

K-L变换和 主成分分析PCA的更多相关文章

随机推荐

热门专题

K-L变换和主成分分析PCA

K-L变换和主成分分析PCA的更多相关文章