降维（二）----Laplacian Eigenmaps

降维系列：

---------------------

前一篇文章中介绍了主成分分析。PCA的降维原则是最小化投影损失，或者是最大化保留投影后数据的方差。在谈到其缺点的时候，我们说这一目标并不一定有助于数据的分类，换句话说，原本在高维空间中属于两类的样本，降维后可能反而不可分了。这时一种经典的降维方法是LDA，其原理是使降维后的数据间类内距离尽可能小，类间距离尽可能大。

使用LDA有个条件，就是要知道降维前数据分别属于哪一类，而且还要知道数据完整的高维信息。然而在Data Mining的很多应用下，我们是不知道数据的具体特征的（也就是高维信息），而仅仅知道数据与数据之间的相似程度。比如，在文本聚类的时候我们可以轻松知道两句话之间多么相似，但是却不一定设计出每句话应抽取什么样的特征形式。在这种应用场景下，我们要对数据进行降维，必然要尽可能保证原本相似的数据在降维后的空间中依然相似，而不相似的数据尽可能还是距离很远。解决这一问题可以采用的方法是MDS，LE，LLE等。这里我就总结总结LE（Laplacian Eigenmaps）。

还要强调一次，不是说后面每一个算法都比前面的好，而是每一种算法的降维目标都不一样，都是从不同角度去看问题。

Laplacian Eigenmaps看问题的角度和LLE十分相似。它们都用图的角度去构建数据之间的关系。图中的每个顶点代表一个数据，每一条边权重代表数据之间的相似程度，越相似则权值越大。并且它们还都假设数据具有局部结构性质。LE假设每一点只与它距离最近的一些点相似，再远一些的数据相似程度为0，降维后相近的点尽可能保持相近。而LLE假设每一个点都能通过周围邻域数据的线性组合来描述，并且降维后这一线性关系尽可能保持不变。不过这里我不主要介绍LLE，主要介绍LE，因为它在spectral clustering中被使用。

首先要构建图的权值矩阵。构建方法为：

1）通过设置一个阈值，相似度在阈值以下的都直接置为零，这相当于在一个 -领域内考虑局部性；
2）对每个点选取 k 个最接近的点作为邻居，与其他的点的相似性则置为零。这里需要注意的是 LE 要求相似度矩阵具有对称性，因此，我们通常会在属于的 k 个最接近的邻居且/或反之的时候，就保留的值，否则置为零；
3）全连通。

以上三种方法构成的矩阵W都是对称的。按理说3会更让大家接受，但是1）和2）能够保证矩阵的稀疏性，而稀疏的矩阵对求特征值是十分方便的。不小心剧透了一下，LE的求解最终还是一个特征值分解问题。不过它和PCA不一样。怎么不一样，后面慢慢说。

LE同样把降维考虑为一种高维到低维的映射，则一个好的映射应该使连通的点靠的更近（作者注：不连通的点按理应该靠远点）。设xi映射后的点为yi，则LE的目标就是最小化以下函数：

如果采用1）和2）的方法构造矩阵，不连通的两点Wij为0，所以降维对它们没有影响。感觉有点不太合理，这不是容忍他们胡作非为么？！按理来说3）应该是更合理一些，但是3）构成的矩阵不是稀疏的╮(╯▽╰)╭。这就是一个trade-off了。而另一方面，靠的近的两个点对应的Wij大，如果降维后他们距离远了，受到的惩罚就会很大。

聪明的话你会一眼看出来：不对啊，降维后如果所有的y都等于同一个值，目标函数显然是最小的，那还搞个屁啊？当然，我们会在后面求解的时候加上这一限制条件，不允许y为一个各维相同的常量。

我们快速对目标函数进行一下整理：

其中，L=D-W，L就叫做Laplacian Matrix。

于是，我们的最小化问题可以等效为：

这个公式是不是就似曾相识了？和PCA的目标函数十分相似，只不过现在的目标函数是求最小值，而PCA是求最大值，约束条件也小小地变形了一下。这个目标的求解就是一个广义特征值分解问题：

说到这里，还有一个问题没有解决，就是刚才提到的“y为一个各维相同的常量”的情况。我们看，L和D都个半正定矩阵，因此特征值都应该大于等于0。可以很快证明，特征值为0时，y的取值（如果有之一的话）是一个全1的向量（可以把矩阵乘积展开来计算一下，左边因为L=D-W的减号作用，结果显然也是0的），也就是我们刚才怀疑到的这种情况。

因此，对于，我们将特征值从小到大排序后，选择第二小的特征值到第m+1小的特征值对应的特征向量（共m个），组成一个Nxm的矩阵，矩阵的每一行就是原来的数据降维后得到的m维特征。你会不会觉得很神奇，原本我们只知道数据与数据之间的相似程度，结果竟然把降维后的特征求出来了！其实求出的特征不过是个相对特征罢了，他们之间相对的距离的远近才是实际重要的，慢慢体会目标函数你就会理解了。

还要再说说这里的特征值。如果仅有一个特征值为0，那么这个graph一定是全通的。关于这个结论我们可以这样证明：

假设f是特征值0对应的特征向量，那么：

如果两个顶点是连通的，那么wij>0，为了满足上式只要让fi=fj。如果graph是连通的话，就能找到一系列w1i,wij,wjk……大于0(其中ijk….分别属于234…N中的一个数)，这样就成立了f1=fj=fk=…..。换句话说，f是一个全为一个数的向量，与全1的向量是同一个向量。又因为仅有这一个向量满足条件，所以仅有一个特征值0满足全通的假设。就证明好了。

将这个结论做点推广，就是如果一个graph可以分为k个连通区域，那么特征值分解后就有k个为0的特征值。

Laplacian Eigenmap具有区分数据点的特性，可以从下面的例子看出：

Laplacian Eigenmap实验结果。左边的图表示有两类数据点（数据是图片），中间图表示采用Laplacian Eigenmap降维后每个数据点在二维空间中的位置，右边的图表示采用PCA并取前两个主要方向投影后的结果，可以清楚地看到，在此分类问题上，Laplacian Eigenmap的结果明显优于PCA。

事实上，LE和LLE都假设数据分布在一个嵌套在高维空间中的低维流形上。Laplacian Matrix其实是流形的 Laplace Beltrami operator的一个离散近似。关于流型和Laplace Beltrami operator我也没有怎么研究过，这里就给这么一个结论给大家。大家可以参考下面给出的两篇参考文献做进一步阅读。

Further Readings：

1. Laplacian Eigenmaps for Dimensionality Reduction and Data Representation

2. A Tutorial on Spectral Clustering

-----------------

jiang1st2010

原文地址：http://blog.csdn.net/jiang1st2010/article/details/8945083

降维（二）----Laplacian Eigenmaps的更多相关文章

四大机器学习降维算法：PCA、LDA、LLE、Laplacian Eigenmaps
四大机器学习降维算法:PCA.LDA.LLE.Laplacian Eigenmaps 机器学习领域中所谓的降维就是指采用某种映射方法,将原高维空间中的数据点映射到低维度的空间中.降维的本质是学习一个映 ...
【转】四大机器学习降维算法：PCA、LDA、LLE、Laplacian Eigenmaps
最近在找降维的解决方案中,发现了下面的思路,后面可以按照这思路进行尝试下: 链接:http://www.36dsj.com/archives/26723 引言机器学习领域中所谓的降维就是指采用某种映 ...
拉普拉斯特征映射（Laplacian Eigenmaps）
1 介绍拉普拉斯特征映射(Laplacian Eigenmaps)是一种不太常见的降维算法,它看问题的角度和常见的降维算法不太相同,是从局部的角度去构建数据之间的关系.也许这样讲有些抽象,具体来讲, ...
降维（一）----说说主成分分析(PCA)的源头
降维(一)----说说主成分分析(PCA)的源头降维系列: 降维(一)----说说主成分分析(PCA)的源头降维(二)----Laplacian Eigenmaps --------------- ...
ML: 降维算法-LE
PCA的降维原则是最小化投影损失,或者是最大化保留投影后数据的方差.LDA降维需要知道降维前数据分别属于哪一类,而且还要知道数据完整的高维信息.拉普拉斯特征映射 (Laplacian Eigenmap ...
ML: 降维算法-概述
机器学习领域中所谓的降维就是指采用某种映射方法,将原高维空间中的数据点映射到低维度的空间中.降维的本质是学习一个映射函数 f : x->y,其中x是原始数据点的表达, y是数据点映射后的低维向量 ...
matlab 降维工具箱
Matlab Toolbox for Dimensionality Reduction 降维方法包括: Principal Component Analysis (PCA) • Probabili ...
降维工具箱drtool
工具箱下载:http://leelab.googlecode.com/svn/trunk/apps/drtoolbox/ ——————————————————————————————————————— ...
TSNE——目前最好的降维方法
转自:http://blog.csdn.net/u012162613/article/details/45920827 1.流形学习的概念流形学习方法(Manifold Learning),简称流形 ...

随机推荐

Android自定义View之ProgressBar出场记
关于自定义View,我们前面已经有三篇文章在介绍了,如果筒子们还没阅读,建议先看一下,分别是android自定义View之钟表诞生记.android自定义View之仿通讯录侧边栏滑动,实现A-Z字母检 ...
oracle学习----去除表中的重复数据
重复的数据可能有这样两种情况,第一种:表中只有某些字段一样,第二种:两行记录完全一样.第一.对于部分字段重复数据的删除先来谈谈如何查询重复的数据吧. 下面语句可以查询出那 ...
Java并发——ReentrantLock类源码阅读
ReentrantLock内部由Sync类实例实现. Sync类定义于ReentrantLock内部. Sync继承于AbstractQueuedSynchronizer. AbstractQueue ...
sbit命令行中运行scala脚本
一般sbit编译器采成了scala运行工具.启动sbit命令行,输入console,命令行自动切换到scala编辑器面. scala>:paste 然后手动将XXX.scala中的代码拷贝到界面 ...
YII中引用自定义类
如果通过actions方法引用其他自定义类时 <?php class LoginController extends Controller { public function actionInd ...
MVC知识总结（前序）
距离2015年的来临还有1天的时间,是时候总结一下今年的经过脑子的知识了,由于今年里工作中接触MVC的时间特别多,所以打算针对MVC这个东西的知识进行一个总结,好歹对得起在几个项目中用了MVC来进行开 ...
python常用函数库转
可能经常用到的标准模块和第三方常用的50个库本文由python培训班授课老师整理数学计算: numbers - Numeric abstract base classes math ...
O-C相关－09-id 类型与应用
09-id 类型与应用 1, 使用 NSObject 访问子类对象方法代码在编辑的时候, Xcode 会实时检查语法情况. 如果调用某个对象的方法, 在声明中没有该方法的声明, 那么就会报错. 但是 ...
javax.el.PropertyNotFoundException: Property 'aDesc' not found on type
这个问题是是在我使用jeesite自动代码是产生的,原因是实体类的属性命名规范不合格,我在网上看到类的属性前三个字母不能出现大写解决办法:将类的属性大小写改一下
10.29_Extjs-lovcombo
(1) Ext.ux.form.LovCombo多选下拉框 :http://www.iteye.com/topic/340900 (2)combox:icon,lovcombo:icon (3) (4 ...

降维（二）----Laplacian Eigenmaps

降维（二）----Laplacian Eigenmaps的更多相关文章

随机推荐

热门专题