PCA和SVD

一、PCA(Principal Component Analysis)

主成分分析，数据从原来的坐标系转换到新的坐标系，只保留新坐标系中的前面几个坐标轴，即对数据进行了降维处理

1、算法描述

（1）第一个新坐标轴：原数据集中方差最大的方向

（2）第二个新坐标轴：与第一个新坐标轴正交且具有最大方差的方向

（3）一直重复，重复次数为原始数据中特征的数目，但是到最后只保留最先产生的几个新坐标轴，而忽略余下的坐标轴

2、步骤

（1）计算样本数据各个特征的平均值

（2）样本各个特征的值：=样本各个特征的值-平均值

（3）计算协方差矩阵

（4）计算协方差矩阵的特征值和特征向量

（5）将特征值逆序排序

（6）保留最上面的N个特征向量

3、举例（待续）

二、SVD（Singular Value Decomposition）

奇异值分解，矩阵分解中的一种，矩阵分解是将数据矩阵分解为多个独立部分的过程

1、算法描述

Data_m*n=U_m*m∑_m*nV^T_n*n

矩阵∑的对角元素是从大到小排列的，这些对角元素称为奇异值

在某个奇异值的数目（r个）之后，其他的奇异值都置为0，即数据集中仅有r个重要特征，而其余特征则都是噪声或者冗余特征

2、如何选取r

（1）保留矩阵中90%的能量信息：将所有的奇异值求平方和，将奇异值的平方和累加到90%为止

（2）当有上万个奇异值时，仅保留前面2000-3000个

3、举例（待续）

4、奇异值分解（待续）

PCA和SVD的更多相关文章

降维方法PCA与SVD的联系与区别
在遇到维度灾难的时候,作为数据处理者们最先想到的降维方法一定是SVD(奇异值分解)和PCA(主成分分析). 两者的原理在各种算法和机器学习的书籍中都有介绍,两者之间也有着某种千丝万缕的联系.本文在简单 ...
PCA和SVD(转)
最近突然看到一个问题,PCA和SVD有什么关系?隐约记得自己照猫画虎实现的时候PCA的时候明明用到了SVD啊,但SVD(奇异值分解)和PCA的(特征值分解)貌似差得相当远,由此钻下去搜集了一些资料,把 ...
What is an intuitive explanation of the relation between PCA and SVD?
What is an intuitive explanation of the relation between PCA and SVD? 36 FOLLOWERS Last asked: 30 Se ...
数据预处理：PCA，SVD，whitening，normalization
数据预处理是为了让算法有更好的表现,whitening.PCA.SVD都是预处理的方式: whitening的目标是让特征向量中的特征之间不相关,PCA的目标是降低特征向量的维度,SVD的目标是提高稀 ...
浅谈 PCA与SVD
前言在用数据对模型进行训练时,通常会遇到维度过高,也就是数据的特征太多的问题,有时特征之间还存在一定的相关性,这时如果还使用原数据训练模型,模型的精度会大大下降,因此要降低数据的维度,同时新数据的特 ...
机器学习实战基础（二十三）：sklearn中的降维算法PCA和SVD（四） PCA与SVD 之 PCA中的SVD
PCA中的SVD 1 PCA中的SVD哪里来? 细心的小伙伴可能注意到了,svd_solver是奇异值分解器的意思,为什么PCA算法下面会有有关奇异值分解的参数?不是两种算法么?我们之前曾经提到过,P ...
机器学习实战基础（二十一）：sklearn中的降维算法PCA和SVD（二） PCA与SVD 之降维究竟是怎样实现
简述在降维过程中,我们会减少特征的数量,这意味着删除数据,数据量变少则表示模型可以获取的信息会变少,模型的表现可能会因此受影响.同时,在高维数据中,必然有一些特征是不带有有效的信息的(比如噪音),或 ...
Machine Learning in Action – PCA和SVD
降维技术, 首先举的例子觉得很好,因为不知不觉中天天都在做着降维的工作对于显示器显示一个图片是通过像素点0,1,比如对于分辨率1024×768的显示器,就需要1024×768个像素点的0,1来表示, ...
PCA和SVD最佳理解
奇异值分解(SVD)原理与在降维中的应用 https://www.cnblogs.com/pinard/p/6251584.html 最通俗易懂的PCA主成分分析推导 https://blog.csd ...
特征向量、特征值以及降维方法（PCA、SVD、LDA）
一.特征向量/特征值 Av = λv 如果把矩阵看作是一个运动,运动的方向叫做特征向量,运动的速度叫做特征值.对于上式,v为A矩阵的特征向量,λ为A矩阵的特征值. 假设:v不是A的速度(方向) 结果如 ...

随机推荐

【以前的空间】poj 2288 Islands and Bridges
一个不错的题解 : http://blog.csdn.net/accry/article/details/6607703 这是一道状态压缩.每个点有一个值,我们最后要求一个最值sum.sum由三部分组 ...
Spark2.1.0之初识Spark
随着近十年互联网的迅猛发展,越来越多的人融入了互联网——利用搜索引擎查询词条或问题:社交圈子从现实搬到了Facebook.Twitter.微信等社交平台上:女孩子们现在少了逛街,多了在各大电商平台上的 ...
BZOJ3144：[HNOI2013]切糕——题解
https://www.lydsy.com/JudgeOnline/problem.php?id=3144 看着很像网络流,但是费用流貌似无法解决这个问题,其实甚至连忽略d的情况都做不到. 最小割? ...
bzoj1025: [SCOI2009]游戏(DP)
题目大意:将长度为n的排列作为1,2,3,...,n的置换,有可能置换x次之后,序列又回到了1,2,3,...,n,求所有可能的x的个数. 看见这种一脸懵逼的题第一要务当然是简化题意...我们可以发现 ...
JS获取移动端系统信息(操作系统、操作系统版本、横竖屏状态、设备类型、网络状态、生成浏览器指纹)
function getOS() { // 获取当前操作系统 var os; if (navigator.userAgent.indexOf('Android') > -1 || navigat ...
ubuntu16.04命令行模式黑屏解决办法
ubuntu16.04命令行模式黑屏解决办法问题描述在ubuntu上装Nvidia的显卡驱动,需要关闭图形界面才能安装驱动,但是,出现如下情况: 使用“ctrl+alt+F1”命令进入命令行界面是 ...
run （牛客多校第二场）计数DP
链接:https://www.nowcoder.com/acm/contest/140/A来源:牛客网题目描述 White Cloud is exercising in the playground ...
Moodle简介
Moodle简介一．概述 Moodle是Modular Object-Oriented Dynamic Learning Environment(模块化面向对象动态学习环境)的简称,中文译名为魔灯, ...
Java设计模式の工厂模式
-------------------------------------------------------- 目录: 一.序言二.简单工厂模式三.工厂方法模式四.简单工厂和工厂方法模式的比 ...
MongoDB入门（6）- 我们自己封装的MongoDB-C#版本
Wisdombud.Mongo 包含内容 MongoDB.Bson.dll MongoDB.Bson.xml MongoDB.Driver.dll MongoDB.Driver.xml Wisdomb ...

PCA和SVD

PCA和SVD的更多相关文章

随机推荐

热门专题