K-L变换

K-L变换（ Karhunen-Loeve Transform）是建立在统计特性基础上的一种变换，有的文献也称为霍特林（Hotelling）变换，因他在1933年最先给出将离散信号变换成一串不相关系数的方法。K-L变换的突出优点是去相关性好，是均方误差（MSE，Mean Square Error）意义下的最佳变换，它在数据压缩技术中占有重要地位。

K-L（Karhunen-Loeve）变换形式

设X=(X1，X2，…，XN)T为N维随机矢量，mX=E(X)和CX=E{(X－mX)(X－mX)T}分别为其平均值向量和协方差矩阵，ei和λi分别为CX的特征向量和对应的特征值，其中i=1，…，N，并设特征值已按降序排列，即λ1≥λ2≥…≥λN，则K-L变换式为：[1]

Y=A(X-mx) (1.1)

其中变换矩阵A的行为CX的特征值，即：

式中：eij表示第i个特征向量的第j个分量。

K-L变换的性质

①Y的均值向量为零向量0。即：

mY=E{Y} =E{A(X-mX)}=0 (1.2)

②K-L变换使矢量信号各分量不相关，即变换域信号的协方差为对角矩阵。

③K-L反变换式为：

X=A-1Y+mX=ATY+mx (1.3)

④K-L变换是在均方误差准则下失真最小的一种变换，故又称作最佳变换。

这条性质与压缩编码有关。其意义是，如果在数据传输中只传送变换后的前n个系数组成的矢量，则根据这n个系数得到的恢复值可以得到最小的均方误差，其值为：

上式表明，在K-L变换下，最小均方误差值等于变换域中矢量信号的最小的N－n个方差的和。特别有意义的是，如果这些分量的均值为零，则在恢复时只要把这些分量置零，便可以使均方误差最小。

图像信号的K-L变换

K-L变换是一维变换，在对图像信号进行变换时，矢量可以是一幅图像或一幅图像中的子图像。矢量各分量之间的相关性反映了像素之间的相关性。为了得到矢量X，可以将图像或子图像的像素按行行相接或列列相接的次序排列，如图1所示。

(a)行行相接

(b)列列相接

图1由二维图像信号建立矢量信号

在建立了矢量信号之后，就要计算协方差矩阵CX，然后计算的特征矢量才能得到K-L变换矩阵A。

由此可见，尽管K-L变换具有性质(2)和(4)的最佳去相关和误差性能，但是由于求解特征值和特征根并非易事，特别是在维数高时甚至可能求不出来，而且变换矩阵与图像的内容有关，因而难以满足实时处理的要求。但是，K-L变换在变换编码中具有理论指导意义，人们通过比较，寻找出一些性能与K-L变换接近，但实现却容易得多的“准最佳”编码方法。

聚类变换认为：重要的分量就是能让变换后类内距离小的分量。类内距离小，意味着抱团抱得紧。但是，抱团抱得紧，真的就一定容易分类么？

如图1所示，根据聚类变换的原则，我们要留下方差小的分量，把方差大（波动大）的分量丢掉，所以两个椭圆都要向y轴投影，这样悲剧了，两个重叠在一起，根本分不开了。而另一种情况却可以这么做，把方差大的分量丢掉，于是向x轴投影，很顺利就能分开了。因此，聚类变换并不是每次都能成功的。

图1

摧枯拉朽的K-L变换

K-L变换是理论上“最好”的变换：是均方误差（MSE，MeanSquare Error）意义下的最佳变换，它在数据压缩技术中占有重要地位。

聚类变换还有一个问题是，必须一类一类地处理，把每类分别变换，让它们各自抱团。

K-L变换要把所有的类别放在一起变换，希望通过这个一次性的变换，让它们分的足够开。

K-L变换认为：各类抱团紧不一定好区分。目标应该是怎么样让类间距离大，或者让不同类好区分。因此对应于2种K-L变换。

其一：最优描述的K-L变换（沿类间距离大的方向降维）

首先来看个二维二类的例子，如图2所示。

图2

$P\left( {{\omega _1}} \right) = P\left( {{\omega _2}} \right) = 0.5$

如果使用聚类变换， ${\Phi _1}$ 方向是方差最小的方向，因此降维向 ${\Phi _1}$ 方向投影，得到2类之间的距离即为2条红线之间的距离，但是这并不是相隔最远的投影方向。将椭圆投影到 ${P_{K - L}}$ 方向，得到2类之间的距离为2条绿线之间的距离。这个方向就是用自相关矩阵的统计平均得到的特征向量 ${\Phi _{K - L}}$

设共有M个类别，各类出现的先验概率为

$P({\omega _i}),i = 1,2, \cdots M$

以 ${x_i}$ 表示来自第i类的向量。则第i类集群的自相关矩阵为：

${R_i} = E\left\{ {{x_i}{x_i}^T} \right\}$

混合分布的自相关矩阵R是：

$R = \sum\limits_{i = 1}^M {P({w_i}){R_i}} = \sum\limits_{i = 1}^M {P({w_i})E\left\{ {{x_i}{x_i}^T} \right\}}$

然后求出R的特征向量和特征值：

$\begin{array}{l}\Lambda = \left( {\begin{array}{*{20}{c}}{{\lambda _1}}& \ldots &0\\ \vdots & \ddots & \vdots & \cdots &{{\lambda _n}}\end{array}} \right)\\\Phi = \left( {{\Phi _1},{\Phi _2}, \cdots {\Phi _n}} \right)\end{array}$

将特征值降序排列（注意与聚类变换区别）

为了降到m维，取前m个特征向量，构成变换矩阵A

$A = {\left( \begin{array}{l}{\Phi _1}^T\\ \vdots \\{\Phi _m}^T\end{array} \right)_{m \times n}} \Rightarrow y = {A_{m \times n}}{x_{n \times 1}}$

以上便完成了最优描述的K-L变换。

为什么K-L变换是均方误差（MSE，MeanSquare Error）意义下的最佳变换？

$\begin{array}{l}{y^{(n)}} = {\Phi ^T}x\\x = \Phi \cdot {y^{(n)}} = \sum\limits_{j = 1}^n {{y_j}^{(n)}{\Phi _j}} \end{array}$

其中 ${y_j}^{(n)}$ 表示n维向量y的第j个分量， ${\Phi _j}$ 表示第个特征分量。

引入的误差

$\Delta x = x - \hat x = \sum\limits_{j = m + 1}^n {{y_j}^{(n)}{\Phi _j}}$

均方误差为

$\begin{array}{l}{e^2}(m) = E\left\{ {{{\left\| {\Delta x} \right\|}^2}} \right\} = E\left\{ {{{[\Delta x]}^T}[\Delta x]} \right\} = E\left\{ {[\sum\limits_{j = m + 1}^n {{y_j}^{(n)}{\Phi _j}^T} ][\sum\limits_{k = m + 1}^n {{y_k}^{(n)}{\Phi _k}} ]} \right\}\\ = \sum\limits_{j = m + 1}^n {E\left\{ {{{[{y_j}^{(n)}]}^2}} \right\}} = \sum\limits_{j = m + 1}^n {E\left\{ {{{[{\Phi _j}^Tx]}^2}} \right\}} = \sum\limits_{j = m + 1}^n {{\Phi _j}^TR{\Phi _j}} = \sum\limits_{j = m + 1}^n {{\lambda _j}} \end{array}$

从m+1开始的特征值都是最小的几个，所以均方误差得到最小。

以上方法称为最优描述的K-L变换，是沿类间距离大的方向降维，从而均方误差最佳。

本质上说，最优描述的K-L变换扔掉了最不显著的特征，然而，显著的特征其实并不一定对分类有帮助。我们的目标还是要找出对分类作用大的特征，而不应该管这些特征本身的强弱。这就诞生了第2种的K-L变换方法。

其二：最优区分的K-L变换（混合白化后抽取特征）

针对上述问题，最优区分的K-L变换先把混合分布白化，再来根据特征值的分离程度进行排序。

最优区分的K-L变换步骤

首先还是混合分布的自相关矩阵R

$R = \sum\limits_{i = 1}^M {P({w_i}){R_i}} = \sum\limits_{i = 1}^M {P({w_i})E\left\{ {{x_i}{x_i}^T} \right\}}$

然后求出R的特征向量和特征值：

以上是主轴变换，实际上是坐标旋转，之前已经介绍过。

令变换矩阵

${A_1} = {\Lambda ^{ - \frac{1}{2}}}{\Phi ^T}$

则有

${A_1}R{A_1}^T = {\Lambda ^{ - \frac{1}{2}}}{\Phi ^T}R\Phi {\Lambda ^{ - \frac{1}{2}}} = I$

这个 ${A_1}$ 作用是白化R矩阵，这一步是坐标尺度变换，相当于把椭圆整形成圆，如图3所示。

图3

以二类混合分布问题为例。

${R_1} + {R_2} = {A_1}{R_1}{A_1}^T + {A_1}{R_2}{A_1}^T = {A_1}R{A_1}^T = I$

分别求出二类的特征向量和特征值，有

$\begin{array}{*{20}{c}}{{S_1} = {\Phi _1}{\Lambda _1}{\Phi _1}^T}\\{{S_2} = I - {S_1} = {\Phi _1}[I - {\Lambda _1}]{\Phi _1}^T}\end{array} \Rightarrow \begin{array}{*{20}{c}}{{\Phi _2} = {\Phi _1}}\\{{\Lambda _1} + {\Lambda _2} = I}\end{array}$

则二者的特征向量完全相同，唯一的据别在于其特征根，而且还负相关，即如果 ${\Lambda _1}$ 取降序排列时，则 ${\Lambda _2}$ 以升序排列。

为了获得最优区分，要使得两者的特征值足够不同。因此，需要舍弃特征值接近0.5的那些特征，而保留使 $\left| {{\lambda _{1i}} - {\lambda _{2i}}} \right|$ 大的那些特征，按这个原则选出了m个特征向量记作

${A_2}^T{\rm{ = }}{\Phi _{11}},{\Phi _{12}}, \ldots ,{\Phi _{1m}}$

则总的最优区分的K-L变换就是：

$A = {A_2}^T{A_1} = {A_1}^T{\Lambda ^{ - \frac{1}{2}}}{\Phi ^T}$

K-L变换的更多相关文章

ACM ICPC 2018 青岛赛区部分金牌题题解(K,L,I,G)
目录: K Airdrop I Soldier Game L Sub-cycle Graph G Repair the Artwork ———————————————————— ps:楼主脑残有点严 ...
Gym 101606 - A/B/C/D/E/F/G/H/I/J/K/L - (Undone)
链接:https://codeforces.com/gym/101606 A - Alien Sunset 暴力枚举小时即可. #include<bits/stdc++.h> using ...
UVa10025-The ? 1 ? 2 ? ... ? n = k problem
分析:因为数字之间只有加减变换,所以-k和k是一样的,都可以当成整数来考虑,只要找到最小的n满足sum=n*(n+1)/2>=k:且sum和k同奇同偶即可,做法是用二分查找,然后在就近查找因为 ...
离散傅立叶变换与快速傅立叶变换（DFT与FFT）
自从去年下半年接触三维重构以来,听得最多的词就是傅立叶变换,后来了解到这个变换在图像处理里面也是重点中的重点. 本身自己基于高数知识的理解是傅立叶变换是将一个函数变为一堆正余弦函数的和的变换.而图像处 ...
基于visual Studio2013解决C语言竞赛题之1087数字变换
题目解决代码及点评 /************************************************************************/ /* ...
1692: [Usaco2007 Dec]队列变换（BZOJ1640强化版）
1692: [Usaco2007 Dec]队列变换 Time Limit: 5 Sec Memory Limit: 64 MBSubmit: 682 Solved: 280[Submit][Sta ...
1640: [Usaco2007 Nov]Best Cow Line 队列变换
1640: [Usaco2007 Nov]Best Cow Line 队列变换 Time Limit: 5 Sec Memory Limit: 64 MBSubmit: 543 Solved: 2 ...
CZT变换（chirp z-transform）
作者:桂. 时间:2018-05-20 12:04:24 链接:http://www.cnblogs.com/xingshansi/p/9063131.html 前言相比DFT,CZT是完成频谱细 ...
$\mathcal{FFT}$·$\mathcal{Fast \ \ Fourier \ \ Transformation}$快速傅立叶变换
$2019.2.18upd:$ $LINK$ 之前写的比较适合未接触FFT的人阅读--但是有几个地方出了错,大家可以找一下233 啊-本来觉得这是个比较良心的算法没想到这么抽搐这个算法真是将一 ...
TOT 傅立叶变换 FFT 入门
HDU 1402,计算很大的两个数相乘. FFT 只要78ms,这里: 一些FFT 入门资料:http://wenku.baidu.com/view/8bfb0bd476a20029bd642d85. ...

随机推荐

2019年北航OO第四次博客总结<完结撒花>
一.UML单元架构设计 1. 类图解析器架构设计 1.1 UML类图这次作业的目标是要解析一个UML类图,首先为了解耦,我新建了一个类UmTree进行解析工作,而Interaction类仅仅作为实现 ...
luogu4016 负载平衡问题
网络流不用动脑子的好爽啊 #include <iostream> #include <cstring> #include <cstdio> #include < ...
java启动的一些参数
-Dcom.sun.management.jmxremote -Dcom.sun.management.jmxremote.port=9001 -Dcom.sun.management.jmxremo ...
MFC自绘按钮的实现，按钮动态效果
最近项目需要实现按钮的动态效果,多方学习,现在终于能实现一些功能了. 过程如下: 第一,新建一MFC对话框应用程序. 第二,删除自带按钮,并添加两个按钮,button1,button2,ID为IDB_ ...
Tensorflow 笔记 -- tensorboard 的使用
Tensorflow 笔记 -- tensorboard 的使用 TensorFlow提供非常方便的可视化命令Tensorboard,先上代码 import tensorflow as tf a = ...
XeLaTeX插入GB/T 7714-2005规范的参考文献方法
GB/T 7714-2005 biblatex 在使用XeLaTeX的过程中,会遇到参考文献需要按照GB/T 7714-2005规范的情况.此时需要使用biblatex宏包,并且指定包的参数为 ...
矩阵快速幂在ACM中的应用
矩阵快速幂在ACM中的应用 16计算机2黄睿博首发于个人博客http://www.cnblogs.com/BobHuang/ 作为一个acmer,矩阵在这个算法竞赛中还是蛮多的,一个优秀的算法可以影 ...
linux下 export只能设定临时变量
今天在调用ABBYY API的时候,需要传递APPID和APPPASSWD给系统环境才能够执行相应的python调用代码. 设置之后,因为写代码自己关掉了terminal,后面直接运行报错,访问权限不 ...
在Asp.net MVC中添加一个全局的异常处理的过滤器及Log4Net的使用
1:捕获异常新建一个异常处理的类MyExceptionAttribute捕获异常信息. //写到日志中.多个线程同时操作一个文件,造成文件的并发,这时用队列 public static Queue&l ...
JAVA接口与抽象类区别
接口 1.接口可以继承多个接口,extends 接口1,接口2,接口3 2.接口的成员变量默认是public static abstract,必须初始化的: 3.接口只能有抽象方法,继承接口的类必须实 ...

K-L变换

K-L变换的性质

图像信号的K-L变换

K-L变换的更多相关文章

随机推荐

热门专题