【转载请注明出处】http://www.cnblogs.com/mashiqi

2014/4/10

在网上找到一个讲reproducing kernel的tutorial看了一看,下面介绍一下。

首先定义kernel(核)

于是我们可以从一个空间定义出一个kernel。接着,我们使用一个kernel来定义一个从到的映射,并称这个映射为reproducing kernel feature map(再生核特征映射):

.

这个映射的意思是:特定的kernel上的一个特定的元素构成了一个映射规则,将的任意元素的映射成一个实数,那么,实际上,就是将映射成了

值得注意的是,在泛函分析中,Hilbert空间上的"表现定理"说的是,任意一个内积都可以等价于一个线性泛函,任意一个线性泛函也等价于某个内积,即对任意线性泛函,使得。然而这里的"再生核特征映射"和"线性泛函"的区别是:

再生核特征映射是由某个核生成的;

而线性泛函是由内积生成的。

下面我们通过这个映射来定义一个Hilbert space。

第一步,构造一个空间(现在它还不完备,稍后会将它完备化)。于是,将所张成的空间记为

第二步,在上定义内积:

于是我们可以很容易的验证此内积满足内积的三个条件。

第三步,将空间完备化。

于是我们就由kernel构造出一个完备的希尔伯特空间,此空间称为reproducing kernel Hilbert space(再生核希尔伯特空间):

在第二步定义内积的过程中,我们可以发现,对于,有

我们称满足为reproducing kernel(再生核)。

Reference

[1] http://www.cs.berkeley.edu/~bartlett/courses/281b-sp08/7.pdf

2014/4/19

今天接着10号继续看再生核空间的内容。

今天终于有了些进展,下面讲讲这个再生核到底是怎么回事。

首先我们有一个由泛函构成的空间:

这些泛函又是定义在集合上的。通常,我们的思路一般会把默认为Hilbert空间,然后将理解为它的对偶空间。我最开始就是这样默认的。但是其实这里不应该这样去理解它。再生核理论基本上了默认以空间为Hilbert空间的,而集合只是理解为一个一般的集合。然后,再生核也是内的一个元,只是他相比较于一般的元而言,拥有更多的性质。好,大概铺垫完了,下面给出一些具体的定义,大部分内容来自

我们首先来给出reproducing Kernel(r.k.再生核)的定义

也就是说,现在我们有一个Hilbert空间,Hilbert空间里面的每一个点都是一个泛函:

也是一个泛函

并且还必须满足两条性质:

1、对于一个固定的是Hilbert空间中的一个元素;

2、再生性质:对于每个,都有:

其中表示Hilbert空间上的内积运算。根据这个再生性质,我们立即可以得到:

值得注意的是,式是一个令人满意的结果,根据这个式子我们可以很容易的得到的正定性。根据这个再生性质,我们立即可以得到以下几个推论(直接截图了):

如果存在则唯一(表示reproducing kernel):

"存在再生核"等价于"每个泛函都连续":

(*注:这里的连续性是指的上的泛函关于连续,而不是指的关于连续)

证明:

上的泛函,当上存在kernel时,有:

而根据式我们有:

所以:

其中无关。所以是有界泛函。又因为显然是线性的,所以是连续泛函。

而当是连续泛函时,因为它是线性的,所以根据表现定理即可证明。

证毕。

这也正如中所说:

再生核的正定性:

正定性证明:

证毕。

(*注:正定性是指在集合上的正定性,)

还有一些其他性质,除了"命题8"以外,其他命题对于本次学习的目标并不是很重要:

接着我们要做的事就是构造这样一个Hilbert空间,这个空间上的内积,以及这个空间上的唯一的一个kernel

Reference

[1] Aronszajn, Nachman. "Theory of reproducing kernels." Transactions of the American mathematical society (1950): 337-404.

[2] 王敏慧,"几类高斯过程的Karhunen-Loève展开及再生核希尔伯特空间"[D],哈尔滨工业大学,2010

[3]Aronsazjn, Par N. "La théorie des noyaux reproduisants et ses applications Première Partie." Mathematical Proceedings of Cambridge Philosophical Society.Vol. 39. No. 03. Cambridge University Press, 1943.

[4] http://www.cs.berkeley.edu/~bartlett/courses/281b-sp08/7.pdf

2014/4/20

今天希望了解到上面所讲的关于RKHS的性质与我们SVM中(以及其他机器学习技术)的核技术的联系。

我们接着看的5.1.3的定理1:

上面的逻辑可以这样描绘(这个图是重点)

上图分别存在三个集合,分别表示集合,RKHS,和我们所需要的空间。分别存在三个映射①②③,分别表示的映射的映射,和之间的映射,当的维数至多可数时,就是空间。首先讲解映射①,因为存在关系式:

所以存在映射,使得:

。又因为都是Hilbert空间,所以同构,所以存在同构映射,使得:

那么,有了这两步的铺垫(映射①与映射②),我们便可以借助搭建之间的映射。结合两式,我们得到:

记新的复合映射为

便得到了:

我们应该注意的是,虽然最后的式并没有涉及到Hilbert空间,但是如果没有空间在其中牵线搭桥,引出两个映射,那我们也不可能找到映射使得式得意满足。数学中的许多抽象概念在一些工程应用中虽不直接体现,但却给这些工程应用搭建了一些桥梁,使得工作可以继续深入!

Reference

[1] Aronszajn, Nachman. "Theory of reproducing kernels." Transactions of the American mathematical society (1950): 337-404.

[2] 王敏慧,"几类高斯过程的Karhunen-Loève展开及再生核希尔伯特空间"[D],哈尔滨工业大学,2010

再生核希尔伯特空间(RKHS)在监督学习(SVM)中的应用的更多相关文章

  1. SVM中径向基函数与高斯核的区别 Difference between RBF and Gaussian kernel in SVM

    Radial Basis Functions (RBFs) are set of functions which have same value at a fixed distance from a ...

  2. 通俗理解Hilbert希尔伯特空间

    作者:qang pan 链接:https://www.zhihu.com/question/19967778/answer/28403912 来源:知乎 著作权归作者所有.商业转载请联系作者获得授权, ...

  3. SVM中的线性分类器

    线性分类器: 首先给出一个非常非常简单的分类问题(线性可分),我们要用一条直线,将下图中黑色的点和白色的点分开,很显然,图上的这条直线就是我们要求的直线之一(可以有无数条这样的直线)     假如说, ...

  4. 希尔伯特空间(Hilbert Space)

    欧氏空间 → 线性空间 + 内积 ⇒ 内积空间(元素的长度,元素的夹角和正交) 内积空间 + 完备性 ⇒ 希尔伯特空间 0. 欧几里得空间 欧氏空间是一个特别的度量空间,它使得我们能够对其的拓扑性质, ...

  5. KD-Tree及希尔伯特空间填充曲线的应用

    引言 我们可能会有这样的一种需求,像是打车软件中呼叫附近的车来接送自己,或者是在qq中查看附近的人.我们都需要知道距离自己一定范围内的其它目标的集合.如果将上面举例的功能抽象出来,就是要实现以某个点为 ...

  6. 借One-Class-SVM回顾SMO在SVM中的数学推导--记录毕业论文5

    上篇记录了一些决策树算法,这篇是借OC-SVM填回SMO在SVM中的数学推导这个坑. 参考文献: http://research.microsoft.com/pubs/69644/tr-98-14.p ...

  7. SVM中为何间隔边界的值为正负1

    在WB二面中,问到让讲一下SVM算法. 我回答的时候,直接答道线性分隔面将样本分为正负两类,取平行于线性切割面的两个面作为间隔边界,分别为:wx+b=1和wx+ b = -1. 面试官就问,为什么是正 ...

  8. 希尔伯特空间(Hilbert Space)是什么?

    希尔伯特空间是老希在解决无穷维线性方程组时提出的概念, 原来的线性代数理论都是基于有限维欧几里得空间的, 无法适用, 这迫使老希去思考无穷维欧几里得空间, 也就是无穷序列空间的性质. 大家知道, 在一 ...

  9. 用户空间和内核空间通讯之【Netlink 中】

    原文地址:用户空间和内核空间通讯之[Netlink 中] 作者:wjlkoorey258 今天我们来动手演练一下Netlink的用法,看看它到底是如何实现用户-内核空间的数据通信的.我们依旧是在2.6 ...

随机推荐

  1. easyui numberbox不可编辑

    今天又遇到了给easyui中numberbox设置不可编辑的功能,在(http://www.jeasyuicn.com/api/docTtml/index.htm)API中找到了一个方法:

  2. CPU信息查询

    cat /proc/cpuinfo |grep "physical id"|sort |uniq|wc -l //查看CPU的个数 cat /proc/cpuinfo |grep ...

  3. QPS

    你想建设一个能承受500万PV/每天的网站吗? 博客分类: 移动行业 PV  转自:http://elf8848.iteye.com/blog/967049 你想建设一个能承受500万PV/每天的网站 ...

  4. 一个快速查看API的汇编和机器码的工具.发布源码

    提供一个早年写的一个小工具,一直在用,赶紧很顺手,特推荐给大家. 欢迎垂询. 1,在OD正在跟踪分析某个保护壳的一段code的时候,感觉似曾相识,好像在哪里见过,好像是某个API.----这个时候你就 ...

  5. parentNode parentElement childNodes children

    首先要了解 parentNode childNodes是W3C标准的. 一下所说都是针对在html中外加chrome浏览器(请原谅我的渣...) 对于html文档而言,可以理解为能分Node树,Ele ...

  6. CodeIgniterCodeigniter+PHPExcel导出数据到Excel文件

    解压压缩包里的Classes文件夹中的内容到application\libraries\目录下,目录结构如下:--application\libraries\PHPExcel.php--applica ...

  7. tomcat http 文件下载

    tomcat作为http的下载服务器,网上有很多办法 但我认为最简单的是: 1.直接把文件放在 tomcat6/webapps/ROOT 目录下, 2.然后在网址中访问: http://120.194 ...

  8. Linux摄像头驱动学习之:(二)通过虚拟驱动vivi分析摄像头驱动

    一.通过指令 "strace -o xawtv.log xawtv" 得到以下调用信息:// 1~7都是在v4l2_open里调用1. open2. ioctl(4, VIDIOC ...

  9. 计算C++类所占用的字节(即sizeof)

    在类中,如果什么都没有,则类占用1个字节,一旦类中有其他的占用空间成员,则这1个字节就不在计算之内,如一个类只有一个int则占用4字节而不是5字节.如果只有成员函数,则还是只占用1个字节,因为类函数不 ...

  10. 压力测试工具——Galting

    为什么要写Gatling呢?网上已经有一些介绍Gatling的好文章了,比如两位TW同事的文章,可以看这里(我知道Gatling也是因为这位作者介绍的),还有这里.主要是因为最近在使用Gatling做 ...