再生核希尔伯特空间(RKHS)在监督学习(SVM)中的应用
【转载请注明出处】http://www.cnblogs.com/mashiqi
2014/4/10
在网上找到一个讲reproducing kernel的tutorial看了一看,下面介绍一下。
首先定义kernel(核)
:

于是我们可以从一个空间
定义出一个kernel。接着,我们使用一个kernel来定义一个从
到的
映射
,并称这个映射为reproducing kernel feature map(再生核特征映射):
.
这个映射的意思是:特定的kernel
和
上的一个特定的元素
构成了一个映射规则,将
的任意元素
的映射成一个实数
,那么,实际上,
就是将
映射成了
。
值得注意的是,在泛函分析
中,Hilbert空间上的"
表现定理"说的是,任意一个内积
都可以等价于一个线性泛函,任意一个线性泛函也等价于某个内积
,即对任意线性泛函
,
,使得
。然而这里的"再生核特征映射"和"线性泛函"的区别是:
再生核特征映射
是由某个核
生成的;
而线性泛函
是由内积
生成的。
下面我们通过这个映射来定义一个Hilbert space。
第一步,构造一个空间
(现在它还不完备,稍后会将它完备化)。于是
,将
所张成的空间记为
:

第二步,在
上定义内积:

于是我们可以很容易的验证此内积满足内积的三个条件。
第三步,将空间
完备化。
于是我们就由kernel
构造出一个完备的希尔伯特空间,此空间称为reproducing kernel Hilbert space(再生核希尔伯特空间):

在第二步定义内积的过程中,我们可以发现,对于
,有

我们称满足
的
为reproducing kernel(再生核)。
Reference
[1] http://www.cs.berkeley.edu/~bartlett/courses/281b-sp08/7.pdf
2014/4/19
今天接着10号继续看再生核空间的内容。
今天终于有了些进展,下面讲讲这个再生核到底是怎么回事。
首先我们有一个由泛函
构成的空间:

这些泛函又是定义在集合
上的。通常,我们的思路一般会把
默认为Hilbert空间,然后将
理解为它的对偶空间。我最开始就是这样默认的。但是其实这里不应该这样去理解它。再生核理论基本上了默认以空间
为Hilbert空间的,而集合
只是理解为一个一般的集合。然后,再生核
也是
内的一个元,只是他相比较于一般的元
而言,拥有更多的性质。好,大概铺垫完了,下面给出一些具体的定义,大部分内容来自
。
我们首先来给出reproducing Kernel(r.k.再生核)的定义
:

也就是说,现在我们有一个Hilbert空间
,Hilbert空间
里面的每一个点都是一个泛函:

而
也是一个泛函
:

并且
还必须满足两条性质:
1、对于一个固定的
,
是Hilbert空间
中的一个元素;
2、再生性质:对于每个
和
,都有:

其中
表示Hilbert空间
上的内积运算。根据这个再生性质,我们立即可以得到:


值得注意的是,式是一个令人满意的结果,根据这个式子我们可以很容易的得到
的正定性。根据这个再生性质,我们立即可以得到以下几个推论(直接截图了):
如果存在则唯一(
表示reproducing kernel):

"存在再生核"等价于"每个泛函
都连续":

(*注:这里的连续性是指的
上的泛函
关于
连续,而不是指的
关于
连续)
证明:
记
上的泛函
为
,当
上存在kernel
时,有:

而根据式我们有:

所以:

其中
和
无关。所以
是有界泛函。又因为
显然是线性的,所以
是连续泛函。
而当
是连续泛函时,因为它是线性的,所以根据
表现定理即可证明。
证毕。
这也正如
中所说:

再生核的正定性:

正定性证明:

证毕。
(*注:正定性是指
在集合
上的正定性,
)
还有一些其他性质,除了"命题8"以外,其他命题对于本次学习的目标并不是很重要:

接着我们要做的事就是构造这样一个Hilbert空间
,这个空间上的内积
,以及这个空间上的唯一的一个kernel
。
Reference
[1] Aronszajn, Nachman. "Theory of reproducing kernels." Transactions of the American mathematical society (1950): 337-404.
[2] 王敏慧,"几类高斯过程的Karhunen-Loève展开及再生核希尔伯特空间"[D],哈尔滨工业大学,2010
[3]Aronsazjn, Par N. "La théorie des noyaux reproduisants et ses applications Première Partie." Mathematical Proceedings of Cambridge Philosophical Society.Vol. 39. No. 03. Cambridge University Press, 1943.
[4] http://www.cs.berkeley.edu/~bartlett/courses/281b-sp08/7.pdf
2014/4/20
今天希望了解到上面所讲的关于RKHS的性质与我们SVM中(以及其他机器学习技术)的核技术的联系。
我们接着看
的5.1.3的定理1:

上面的逻辑可以这样描绘(这个图是重点):

上图分别存在三个集合
,分别表示集合
,RKHS
,和我们所需要的空间
。分别存在三个映射①②③,分别表示
到
的映射
,
到
的映射
,和
到
之间的映射
,当
的维数至多可数时,
就是
空间。首先讲解映射①,因为存在关系式:

所以存在映射
,使得:

。又因为
与
都是Hilbert空间,所以同构,所以存在同构映射
,使得:

那么,有了这两步的铺垫(映射①与映射②),我们便可以借助
和
搭建
到
之间的映射
。结合两式,我们得到:

记新的复合映射为
:

便得到了:

我们应该注意的是,虽然最后的式并没有涉及到Hilbert空间
,但是如果没有空间
在其中牵线搭桥,引出两个映射
和
,那我们也不可能找到映射
使得式得意满足。数学中的许多抽象概念在一些工程应用中虽不直接体现,但却给这些工程应用搭建了一些桥梁,使得工作可以继续深入!
Reference
[1] Aronszajn, Nachman. "Theory of reproducing kernels." Transactions of the American mathematical society (1950): 337-404.
[2] 王敏慧,"几类高斯过程的Karhunen-Loève展开及再生核希尔伯特空间"[D],哈尔滨工业大学,2010
再生核希尔伯特空间(RKHS)在监督学习(SVM)中的应用的更多相关文章
- SVM中径向基函数与高斯核的区别 Difference between RBF and Gaussian kernel in SVM
Radial Basis Functions (RBFs) are set of functions which have same value at a fixed distance from a ...
- 通俗理解Hilbert希尔伯特空间
作者:qang pan 链接:https://www.zhihu.com/question/19967778/answer/28403912 来源:知乎 著作权归作者所有.商业转载请联系作者获得授权, ...
- SVM中的线性分类器
线性分类器: 首先给出一个非常非常简单的分类问题(线性可分),我们要用一条直线,将下图中黑色的点和白色的点分开,很显然,图上的这条直线就是我们要求的直线之一(可以有无数条这样的直线) 假如说, ...
- 希尔伯特空间(Hilbert Space)
欧氏空间 → 线性空间 + 内积 ⇒ 内积空间(元素的长度,元素的夹角和正交) 内积空间 + 完备性 ⇒ 希尔伯特空间 0. 欧几里得空间 欧氏空间是一个特别的度量空间,它使得我们能够对其的拓扑性质, ...
- KD-Tree及希尔伯特空间填充曲线的应用
引言 我们可能会有这样的一种需求,像是打车软件中呼叫附近的车来接送自己,或者是在qq中查看附近的人.我们都需要知道距离自己一定范围内的其它目标的集合.如果将上面举例的功能抽象出来,就是要实现以某个点为 ...
- 借One-Class-SVM回顾SMO在SVM中的数学推导--记录毕业论文5
上篇记录了一些决策树算法,这篇是借OC-SVM填回SMO在SVM中的数学推导这个坑. 参考文献: http://research.microsoft.com/pubs/69644/tr-98-14.p ...
- SVM中为何间隔边界的值为正负1
在WB二面中,问到让讲一下SVM算法. 我回答的时候,直接答道线性分隔面将样本分为正负两类,取平行于线性切割面的两个面作为间隔边界,分别为:wx+b=1和wx+ b = -1. 面试官就问,为什么是正 ...
- 希尔伯特空间(Hilbert Space)是什么?
希尔伯特空间是老希在解决无穷维线性方程组时提出的概念, 原来的线性代数理论都是基于有限维欧几里得空间的, 无法适用, 这迫使老希去思考无穷维欧几里得空间, 也就是无穷序列空间的性质. 大家知道, 在一 ...
- 用户空间和内核空间通讯之【Netlink 中】
原文地址:用户空间和内核空间通讯之[Netlink 中] 作者:wjlkoorey258 今天我们来动手演练一下Netlink的用法,看看它到底是如何实现用户-内核空间的数据通信的.我们依旧是在2.6 ...
随机推荐
- 推荐cms
推荐cms : 国外:drupal joomla wordpress 国内:phpcms
- MySql中添加用户/删除用户
MySql中添加用户,新建数据库,用户授权,删除用户,修改密码(注意每行后边都跟个;表示一个命令语句结束): 1.新建用户 登录MYSQL: @>mysql -u root -p @>密码 ...
- How to Run a .Jar Java File
.jar files are used for archiving, archive unpacking. One of the essential features of jar file is l ...
- HDU 1698 区间更新
Just a Hook Time Limit: 4000/2000 MS (Java/Others) Memory Limit: 32768/32768 K (Java/Others)Total ...
- 安装VMWare tools,以及解决安装后/mnt中有hgfs但没共享文件的方法
一.首先是安装VMWare tools 安装过程可参考:Installing VMware Tools in an Ubuntu virtual machine 安装成功后,可看的如下信息: ...
- ASP.NET MVC 4使用Bundle的打包压缩JS/CSS
打包(Bundling)及压缩(Minification)指的是将多个js文件或css文件打包成单一文件并压缩的做法,如此可减少浏览器需下载多个文件案才能完成网页显示的延迟感,同时通过移除JS/CSS ...
- xml装php数组
$data = simplexml_load_string($res, 'SimpleXMLElement', LIBXML_NOCDATA); $arr = converArray($data); ...
- 第46套题【STL】【贪心】【递推】【BFS 图】
已经有四套题没有写博客了.今天改的比较快,就有时间写.今天这套题是用的图片的形式,传上来不好看,就自己描述吧. 第一题:单词分类 题目大意:有n个单词(n<=10000),如果两个单词中每个字母 ...
- Cocoapods的安装与使用
一.安装 1.CocoaPods是用Ruby实现的,要想使用它首先需要有Ruby的环境.OS X系统默认已经可以运行Ruby了,因此我们只需执行以下命令: sudo gem install cocoa ...
- gsoap框架下的onvif程序流程分析
SOAP_FMAC5 int SOAP_FMAC6 soap_serve(struct soap *soap) { do { unsigned int k = soap->max_keep_al ...