Manifold Learning: ISOMAP

转：http://hi.baidu.com/chb_seaok/item/faa54786a3ddd1d7d1f8cd0b

在常见的降维方法中，PCA和LDA是最为常用的两种降维方法。PCA是一种无监督方法，它关注的是将数据沿着方差最大化的方向映射。而LDA是一种监督方法，它寻找映射轴（类之间耦合度低，类内的聚合度高），两种方法估计的都是全局的统计信息（均值和协方差）。

manifold learning是最近比较热门的领域，它是一种非线性降维技术，主要研究的是高维数据的潜在的流行结构。首先我们来看下为什么要进行流行学习，先看经典图：

图1

数据在高维空间空间中，什么事合理的距离度量（两个点之间的距离）成了关键，如图1，如果我们用欧式距离分别来度量图中红点与蓝点和黄点的距离的话，红点与蓝点的距离应该较红点与黄点距离远。事实上是否如此的，该距离是否真实的反应了数据之间的距离关系呢？想象力丰富的同学可能可以看出来，这些数据像一条丝带，把他在一个平面内展开，再去度量红点与蓝点和黄点的距离是否更为合理些？

ISOMAP是manifold learning的最为常见的一种方法，它主要的思想是用n维的欧式空间近似于一个N维的流行(n<<N).

第一步：构建点的邻居

图2

用KNN最近邻居算法对高维数据构建一个稀疏图，如果是该点邻居，则添加一条边，两点之间的距离则为欧式距离。

第二步：根据构建的图计算点与点之间最短距离

注：我们用点与点之间最短距离近似于geodesic距离（根据weak bound和asymptotic convergence定理）

计算最短路用Dijkstra或者Floyd算法计算，得到一个距离矩阵M,（表示的是点与点之间的距离）

图3

第三步：高维数据映射到低维空间

建立一个损失函数：

，

注：DG代表原图中数据，DY代表映射后数据

为了使E尽量小，解决的方法类似于PCA，进行矩阵分解，取前P个特征根，也就是将数据映射到P维空间。

PCA分解的是协方差矩阵，而ISOMAP也要进行类似的处理。在第二步中我们计算出距离矩阵M,对M进行算子操作，

= （1）

（2）

注：N为样本数据点个数，为克罗内克函数.

该步的算子操作类似于PCA中的减去均值操作，然后进行矩阵分解，取前P个特征根。

至此，ISOMAP完成了高维数据的非线性降维，降维后的数据极大的保持全局的geodesic距离信息。

Manifold Learning: ISOMAP的更多相关文章

流形学习（manifold learning）综述
原文地址:https://blog.csdn.net/dllian/article/details/7472916 假设数据是均匀采样于一个高维欧氏空间中的低维流形,流形学习就是从高维采样数据中恢复低 ...
转载manifold learning一篇
我恨自己不干活儿,不过也没辙. 早晚要学习流形的,今天先转一篇文章,以后找不到就尿了. 我真羡慕数学系的人,╮(╯▽╰)╭. 发信人: Kordan (K&M), 信区: AI标题: do ...
流形学习 (Manifold Learning)
流形学习 (manifold learning) zz from prfans............................... dodo:流形学习 (manifold learning) ...
Manifold learning 流形学习
Machine Learning 虽然名字里带了 Learning 一个词,让人乍一看觉得和 Intelligence 相比不过是换了个说法而已,然而事实上这里的 Learning 的意义要朴素得多. ...
流形学习（manifold learning）的一些综述
流形学习(manifold learning)的一些综述讨论与进展 issue 26 https://github.com/memect/hao/issues/26 Introduction htt ...
机器学习算法总结(十二)——流形学习（Manifold Learning）
1.什么是流形流形学习的观点:认为我们所能观察到的数据实际上是由一个低维流行映射到高维空间的.由于数据内部特征的限制,一些高维中的数据会产生维度上的冗余,实际上这些数据只要比较低的维度就能唯一的表示 ...
sklearn 下的流行学习（Manifold Learning）—— sklearn.manifold
1. t-SNE from sklearn.manifold import TSNE X_proj = TSNE(random_state=123).fit_transform(X) 2. t_sne ...
manifold learning
MDS, multidimensional scaling, 线性降维方法, 目的就是使得降维之后的点两两之间的距离尽量不变(也就是和在原是空间中对应的两个点之间的距离要差不多).只是 MDS 是针对 ...
流行-Manifold学习理解与应用
流行-Manifold[1] 流形,也就是 Manifold . 1. 比较好的形象理解流形学习的观点是认为,我们所能观察到的数据实际上是由一个低维流形映射到高维空间上的,即这些数据所在的空间是“ ...

随机推荐

10个重要的算法C语言实现源代码
包括拉格朗日,牛顿插值,高斯,龙贝格,牛顿迭代,牛顿-科特斯,雅克比,秦九昭,幂法,高斯塞德尔 .都是经典的数学算法,希望能开托您的思路.转自kunli.info 1.拉格朗日插值多项式 ,用于离散数 ...
Android使用7牛云存储
第一次使用这个云存储,话说7牛云存储大有来头!区别于国内外其他云存储,七牛自行研发的全分布式架构解决了其他云存储单一数据中心架构可能存在的风险,同时首创双向加速特性对数据上传下载均加速,使得数据访问速 ...
unity Socket TCP连接案例（一）
非常清晰的demo 服务端 using System; using System.Collections; using System.Collections.Generic; using System ...
js confirm实现换行
js中confirm或者alert不识别标签,所以要换行的话可以采用下面方式 \u000d 或者 \r: <script> var res=confirm(\"这是测试工作: \ ...
js扩展
http://www.css88.com/doc/underscore/#findWhere
Expression Blend实例中文教程(4) - 布局控件快速入门Canvas
上一篇,我介绍了Silverlight控件被分为三种类型, 第一类: Layout Controls(布局控件) 第二类: Item Controls (项目控件) 第三类: User Interac ...
C# 页面抽奖实例 asp.net
<!DOCTYPE html> <html xmlns="http://www.w3.org/1999/xhtml"> <head runat=&qu ...
前端标注软件-pxcook像素大厨使用心得
我们在日常开发过程中,设计师给提供的UI图,经常需要标注尺寸,有时候设计师难免会遗漏标注,这样就会大大的增加我们的沟通成本,因此,使用一款好用的标注软件就尤为重要,我推荐这款标注软件---pxcook ...
把一个项目a生成后放在另一个项目b使用（b项目是例子中的ScreenWebPage_Tool）
a项目属性---生成事件---后期生成事件命令行 xcopy /r /y $(TargetDir)*.* $(SolutionDir)ScreenWebPage_Tool\bin\Debug\* ...
pyhton中list的基本操作
list:可以按规则,按顺序,存取大量数据 1.增 append() 在列表尾部追加元素 insert() 按照列表索引添加元素 extend() 迭代添加元素,一次添加多个元素 2.删 pop() ...

Manifold Learning: ISOMAP

Manifold Learning: ISOMAP的更多相关文章

随机推荐

热门专题