A ROBUST KERNEL PCA ALGORITHM
引
这篇文章的思想很简单,如何将robust 和 kernel结合起来:找出异常值,将异常值排除,再进行kernel PCA。但是实际上,并非这么容易。
首先,论文抛出了俩个问题:
1.在原空间中为异常值的点,通过kernel隐式地被映射到高维空间后是否依旧是异常值;
2.如何判断该点是否为异常值。
主要内容
问题一
论文引了一篇文献来说明此问题,我没有去查阅:
当非线性映射\(\Phi(\cdot)\)为连续平滑(可微?)的函数是,数据的拓扑结构 不变。所以,一般的kernel应当是符合条件的。
问题二
论文圈定一个范围,先找到一个超球体,将所有的数据点都包裹进去的最小超球体,即:
\]
其中\(c\)是球体的中心,假设\(c = \sum \limits_i \lambda_i^0 \Phi(x_i)\),那么\(\lambda_i^0\)将是下列方程的最优解(这个也是引入文献说明的,我也不打算深究):

好吧,截个图:

有了中心,我们就可以通过计算\(\Phi(x_i)\)与\(c\)的最大距离来确定\(R\):

好了,现在\(R\)也找到了,可是,所有的点都在超球内,得找一个\(R'\)来限定出一些奇异值来,问题是\(R'\)该怎么找呢?这个地方我真的觉得蛮扯的,找一个\(R'\)使得异常点的数量为\(3\% \sim 5\%\),这个怎么说呢,我觉得会不会太主观了。所以,就是以一定步长来搜索\(R'\)?感觉好蠢。
A ROBUST KERNEL PCA ALGORITHM的更多相关文章
- Robust De-noising by Kernel PCA
		
目录 引 主要内容 Takahashi T, Kurita T. Robust De-noising by Kernel PCA[C]. international conference on art ...
 - Kernel Methods (5) Kernel PCA
		
先看一眼PCA与KPCA的可视化区别: 在PCA算法是怎么跟协方差矩阵/特征值/特征向量勾搭起来的?里已经推导过PCA算法的小半部分原理. 本文假设你已经知道了PCA算法的基本原理和步骤. 从原始输入 ...
 - Principal Component Analysis(PCA) algorithm summary
		
Principal Component Analysis(PCA) algorithm summary mean normalization(ensure every feature has sero ...
 - Kernel PCA 原理和演示
		
Kernel PCA 原理和演示 主成份(Principal Component Analysis)分析是降维(Dimension Reduction)的重要手段.每一个主成分都是数据在某一个方向上的 ...
 - 【模式识别与机器学习】——PCA与Kernel PCA介绍与对比
		
PCA与Kernel PCA介绍与对比 1. 理论介绍 PCA:是常用的提取数据的手段,其功能为提取主成分(主要信息),摒弃冗余信息(次要信息),从而得到压缩后的数据,实现维度的下降.其设想通过投影矩 ...
 - Probabilistic PCA、Kernel PCA以及t-SNE
		
Probabilistic PCA 在之前的文章PCA与LDA介绍中介绍了PCA的基本原理,这一部分主要在此基础上进行扩展,在PCA中引入概率的元素,具体思路是对每个数据$\vec{x}_i$,假设$ ...
 - Kernel PCA and De-Noisingin Feature Spaces
		
目录 引 主要内容 Kernel PCA and De-Noisingin Feature Spaces 引 kernel PCA通过\(k(x,y)\)隐式地将样本由输入空间映射到高维空间\(F\) ...
 - Kernel PCA for Novelty Detection
		
目录 引 主要内容 的选择 数值实验 矩形框 spiral 代码 Hoffmann H. Kernel PCA for novelty detection[J]. Pattern Recognitio ...
 - Missing Data in Kernel PCA
		
目录 引 主要内容 关于缺失数据的导数 附录 极大似然估计 代码 Sanguinetti G, Lawrence N D. Missing data in kernel PCA[J]. europea ...
 
随机推荐
- JavaScript 链表
			
------------恢复内容开始------------ 背景 数组并不总是组织数据的最佳数据结构,原因如下.在很多编程语言中,数组的长度是固定的,所以当数组已被数据填满时,再要加入新的元素就会非 ...
 - 【Reverse】每日必逆0x02
			
BUU SimpleRev 附件 https://files.buuoj.cn/files/7458c5c0ce999ac491df13cf7a7ed9f1/SimpleRev 题解 查壳 拖入iad ...
 - Linux启动初始化配置文件
			
Linux启动初始化配置文件(1)/etc/profile 登录时,会执行. 全局(公有)配置,不管是哪个用户,登录时都会读取该文件. (2)/ect/bashrc Ubuntu没有此文件,与之对应的 ...
 - AI常用环境安装
			
torch环境 conda create --name py37 python=3.7 conda activate py37 pip install jieba==0.42.1pip install ...
 - spring 事务处理中,同一个类中:A方法(无事务)调B方法(有事务),事务不生效问题
			
public class MyEntry implements IBaseService{ public String A(String jsonStr) throws Exception{ User ...
 - 侵入式&非侵入式
			
侵入式设计 引入了框架,对现有的类的结构有影响:即需要实现或继承某些特定类. 例如:Struts框架 非侵入式设计 引入了框架,对现有的类结构没有影响. 例如:Hibernate框架 / Spring ...
 - 【Java 8】Predicate详解
			
一.java.util.function.Predicate 这里类是java自带主要广泛用在支持lambda表达式的API中. 1.接口源码 @FunctionalInterface public ...
 - Docker(4)-docker常用命令
			
帮助命令 docker version # 查看docker的版本信息 docker info # 查看docker的系统信息,包含镜像和容器的数量 docker --help # 帮助命令 dock ...
 - 从Rest到Graphql
			
一.引言 ok,如图所示,我在去年曾经写过一篇文章<闲侃前后端分离的必要性>.嗯,我知道肯定很多人没看过.所以我做一个总结,其实啰里八嗦了一篇文章,就是想说一下现在的大型互联网项目一般是如 ...
 - Linux用户家目录被删除救回
			
一.说明 家目录被删除,如果直接新建一个目录,用户是不识别的 二.操作 1.随便先创建一个用户,需要用到他的一些文件 useradd test 2.假如admin用户的家目录没了,需要修复 cd te ...