The paper: Hui Zou, Trevor Hastie, and Robert Tibshirani, Sparse Principal Component Analysis, Journal of computational and Graphical Statistics, 15(2): 265-286, 2006. Reproduction of the Synthetic Example in Section 5.2 using R programming: library(…
目录 背景 总括 Hotelling's deflation 公式 特点 Projection deflation 公式 特点 Schur complement deflation Orthogonalized projection deflation 公式 Orthogonalized Hotelling's deflation 公式 特点 背景 有很多Sparse PCA 算法运用了收缩算法,但是呢,往往只考虑如何解决,每一次迭代的稀疏化问题,而忽略了收缩算法的选择. 总括 Hotellin…
目录 概括 Sparse PCA Formulation 非常普遍的问题 Optimality Conditions Eigenvalue Bounds 算法 代码 概括 这篇论文,不像以往的那些论文,构造优化问题,然后再求解这个问题(一般都是凸化).而是,直接选择某些特征,自然,不是瞎选的,论文给了一些理论支撑.但是,说实话,对于这个算法,我不敢苟同,我觉得好麻烦的. Sparse PCA Formulation 非常普遍的问题 Optimality Conditions 这一小节,论文给出了…
Sparse PCA 稀疏主成分分析 2016-12-06 16:58:38 qilin2016 阅读数 15677 文章标签: 统计学习算法 更多 分类专栏: Machine Learning   版权声明:本文为博主原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接和本声明. 本文链接:https://blog.csdn.net/zhoudi2010/article/details/53489319 SPCA原始文献:H. Zou (2006) Sparse princi…
目录 背景 Sparse eigenvectors(单个向量的稀疏化) 初始问题(low-rank的思想?) 等价问题 最小化\(\lambda\) 得到下列问题(易推) 再来一个等价问题 条件放松(凸化) A robustness interpretation 收缩 关于半正定规划,回头再看看. 背景 上篇总结了一些收缩法,这篇论文就是一个示例,虽然这篇论文是在那人之前写的. Sparse eigenvectors(单个向量的稀疏化) \(A \in \mathrm{S}^{n} \right…
主成分分析(Principal components analysis,以下简称PCA)是最重要的降维方法之一.在数据压缩消除冗余和数据噪音消除等领域都有广泛的应用.一般我们提到降维最容易想到的算法就是PCA,下面我们就对PCA的原理做一个总结. 1. PCA的思想 PCA顾名思义,就是找出数据里最主要的方面,用数据里最主要的方面来代替原始数据.具体的,假如我们的数据集是n维的,共有m个数据$(x^{(1)},x^{(2)},...,x^{(m)})$.我们希望将这m个数据的维度从n维降到n'维…
之前总结过关于PCA的知识:深入学习主成分分析(PCA)算法原理.这里打算再写一篇笔记,总结一下如何使用scikit-learn工具来进行PCA降维. 在数据处理中,经常会遇到特征维度比样本数量多得多的情况,如果拿到实际工程中去跑,效果不一定好.一是因为冗余的特征会带来一些噪音,影响计算的结果:二是因为无关的特征会加大计算量,耗费时间和资源.所以我们通常会对数据重新变换一下,再跑模型.数据变换的目的不仅仅是降维,还可以消除特征之间的相关性,并发现一些潜在的特征变量. 降维算法由很多,比如PCA…
一:引入问题 首先看一个表格,下表是某些学生的语文,数学,物理,化学成绩统计: 首先,假设这些科目成绩不相关,也就是说某一科目考多少分与其他科目没有关系,那么如何判断三个学生的优秀程度呢?首先我们一眼就能看出来,数学,物理,化学这三门课的成绩构成了这组数据的主成分(很显然,数学作为第一主成分,因为数据成绩拉的最开). 那么为什么我们能一眼看出来呢? 当然是我们的坐标轴选对了!! 下面,我们继续看一个表格,下标是一组学生的数学,物理,化学,语文,历史,英语成绩统计: 那么这个表我们能一眼看出来吗?…
目录 背景: 部分符号 创新点 文章梗概 The LASSO AND THE ELASTIC NET 将PCA改造为回归问题 定理二 单个向量(无需进行SVD版本) 定理三 多个向量(无需进行SVD, 非LASSO,非elastic net) 目标函数(最终版) 算法一 方差计算 复杂度 \(p \gg n\) 算法改进 数值实验(pitprops) 背景: sparse PCA 较 PCA来说更具可解释性,泛化性. 部分符号 \(\mathrm{X} \in \mathbb{R}^{n \ti…
目录 背景 Notation Sparse PCA Semidefinite Relaxation Low Rank Optimization Sorting and Thresholding 背景 懒得说了,毕竟和上一篇作者都是一个人,有特殊的情况是,上次做的复杂度过大,这次降低了复杂度. Notation Sparse PCA 在上篇论文里面,也提到了这个式子.上次是用它来进行一个robust的解释,这一次,是来试图解决这个问题. \(\Sigma_{ii} \quad i=1,2,\ldo…