奇异值分解(SVD)(基础知识)
参考:https://www.cnblogs.com/pinard/p/6251584.html
参考:http://blog.csdn.net/u010099080/article/details/68060274
参考:https://www.zhihu.com/question/22237507
定义:
SVD用于对矩阵进行分解,假设待分解矩阵A大小为m×n的矩阵,那么矩阵A的SVD为:

以上的U是一个mxm的矩阵,Σ是一个mxn的矩阵,除了主对角线意外其他值均为0,主对角线上每个元素均为奇异值,V是一个nxn的矩阵,且U和V均满足
.
下面则介绍如何求得U、Σ、V的过程。
我们将A的转置和A作矩阵相乘,那么得到nxn的方阵
,由于这是一个方阵,那么我们可以进行特征分解,得到特征值和特征向量满足下式子:

这样我们则得到
的特征值和对应的特征向量,将特征向量组成一个nxn的矩阵,那么就得到SVD公式的V矩阵,一般将V的每个特征向量叫做A的右奇异向量。
若将A和A的转置作矩阵相乘,那么得到mxm的矩阵
,同样进行特征分解,得到如下的特征值和特征向量:

这样则得到对应的m个特征向量u和m个特征值,将
的所有特征向量组成一个mxm的特征矩阵U,那么就能得到SVD矩阵里的U矩阵,一般我们将U中的每个特征向量称为A的左奇异向量。
剩下的求奇异值矩阵Σ过程,由于其除了对角线上的奇异值之外其他都是0,那么我们只需要求出对应的奇异值σ即可。
由于:

那么我们就可以得到各奇异值,进而得到奇异矩阵Σ.
判断
和
得到的特征向量组成的矩阵分别为V矩阵和U矩阵,以如下为例(ΣT=Σ):

从而发现
的特征向量组成的就是SVD分解中的V矩阵,进一步可以发现特征值矩阵为奇异值矩阵的平方,即得到奇异值和特征值满足关系
,同理可以得到
的特征向量组成的就是SVD分解中的U矩阵。
由于奇异值和我们特征分解中的特征值类似,在奇异值矩阵中同样是从大到小排序,且奇异值减小速度非常快,在很多情况下,少量的奇异值之和能占全部奇异值之和的较高的比例,因而我们用最大的k个奇异值及对应的左右奇异向量来近似描述矩阵,即有如下表示:

其中k比n小很多,即大的矩阵A可以分解为3个小的矩阵来表示。
由于如上性质,SVD分解可以用于PCA降维,可以用来数据压缩和降噪,也可以用于推荐算法,将用户和喜好对应的矩阵作特征分解,进而得到隐含的用户需求来做推荐。
SVD在PCA中的应用:
具体可以参考:https://www.cnblogs.com/pinard/p/6251584.html 中对PCA的讲解
在PCA原理中,提到PCA降维,需要找到样本协方差矩阵
中最大的d个特征向量,然后将这d个最大的特征向量组成矩阵来作低维投影降维,在这个过程中需要先求出协方差矩阵
,当样本数和特征数都很多的时候计算量会比较大。
由于有些SVD的实现算法可以不先求出对应的协方差矩阵
,也可以得到对应的右奇异矩阵V,即我们不需要对PCA算法做特征分解,而是通过做SVD来完成,该方法在样本量较大的时候比较有效,其中scikit-learn的PCA算法背后真正实现的是SVD算法。
另一方面,PCA仅使用了SVD的右奇异矩阵,并没有使用左奇异矩阵。那么左奇异矩阵的作用在于:
假设我们的样本是m x n 的矩阵X,我们通过SVD分解得到
最大的d个特征向量组成的m x d维矩阵U,那么我们通过如下处理:

可以得到d x n的矩阵X‘,这个矩阵和我们原来m x n维的样本矩阵X相比,行数从原来的m减少到了d,从而对行数进行压缩,也就是说左奇异矩阵用于对行数压缩,右奇异矩阵用于对列数进行压缩,也就是PCA降维。
例子:
计算得:

根据
,得到特征值
从而得到单位化的特征矩阵U为:

同理求解
的特征值和特征向量,将特征值降序排列之后得到单位化的特征向量矩阵V为:

根据特征值的平方根得到对角矩阵:

到此,矩阵A通过SVD分解得到:

奇异值分解(SVD)(基础知识)的更多相关文章
- 强大的矩阵奇异值分解(SVD)及其应用
版权声明: 本文由LeftNotEasy发布于http://leftnoteasy.cnblogs.com, 本文可以被全部的转载或者部分使用,但请注明出处,如果有问题,请联系wheeleast@gm ...
- 机器学习中的数学-矩阵奇异值分解(SVD)及其应用
转自:http://www.cnblogs.com/LeftNotEasy/archive/2011/01/19/svd-and-applications.html 版权声明: 本文由LeftNotE ...
- 机器学习中的数学(5)-强大的矩阵奇异值分解(SVD)及其应用
版权声明: 本文由LeftNotEasy发布于http://leftnoteasy.cnblogs.com, 本文可以被全部的转载或者部分使用,但请注明出处,如果有问题,请联系wheeleast@gm ...
- Matlab - 基础知识
Matlab R2016a完全自学一本通 记在前面: (1)函数中:dim=1 按列:dim=2 按行 (2)这本书很垃圾,不建议买. (3)在数据库连接中,用两个单引号表示字符串,千万不能用双引号 ...
- 强大的矩阵奇异值分解(SVD)
转:http://www.cnblogs.com/LeftNotEasy/archive/2011/01/19/svd-and-applications.html 前言: PCA的实现一般有两种,一种 ...
- 奇异值分解(SVD)原理及应用
一.奇异值与特征值基础知识: 特征值分解和奇异值分解在机器学习领域都是属于满地可见的方法.两者有着很紧密的关系,我在接下来会谈到,特征值分解和奇异值分解的目的都是一样,就是提取出一个矩阵最重要的特征. ...
- 矩阵奇异值分解(SVD)
转自:https://www.cnblogs.com/LeftNotEasy/archive/2011/01/19/svd-and-applications.html (感谢,讲解的太好了) 在机器 ...
- 机器学习中的数学-强大的矩阵奇异值分解(SVD)及其应用
版权声明: 本文由LeftNotEasy发布于http://leftnoteasy.cnblogs.com, 本文可以被全部的转载或者部分使用,但请注明出处,如果有问题,请联系wheeleast@gm ...
- 奇异值分解SVD
在介绍奇异值分解(SVD)之前我们先来回顾一下关于矩阵的一些基础知识. 矩阵基础知识 方阵 给定一个$ n×m $的矩阵$ A $,若n和m相等也就是矩阵的行和列相等那矩阵$ A $就是一个方阵. 单 ...
随机推荐
- Gradle 详解
Gradle简单来说,就是工程的管理,帮我们做了依赖,打包,部署,发布等工作.就像一个管家管理我们的项目,我们只用关心写代码就可以了. 1 gradle-wraaper.properties 主工程的 ...
- 简单三步同步你的 VSCode 用户配置
https://www.cnblogs.com/knight-errant/p/10444777.html 设备重装,换设备,VSCode 又要重新配置了?不不不,简单三步,让你的 VSCode 配置 ...
- Oracle数据备份与恢复
为了保证数据库的高可用性,Oracle数据库提供了备份和恢复机制,以便在数据库发生故障时完成对数据库的恢复操作,避免损失重要的数据资源 丢失数据分为:物理丢失:操作系统的数据库主键(数据文件.控机文件 ...
- python2.7+appium第一个脚本(使用夜神模拟器)
搭建好环境后,可以开始准备脚本的编写工作 目录 1.安装夜神模拟器 2.使用uiautomatorviewer定位 3.运行第一个脚本 1.安装夜神模拟器 第一步:官网下载夜神模拟器,完成安装 双击下 ...
- Visual Studio关于项目迁移或拉取代码产生的dll黄色感叹号警告问题解决方案
今天换了台大电脑,准备好好爽一下, 就把笔记本上的项目拷贝到了台式机上, 但是我没有拷贝解决方案整个文件夹,因为其中项目太多了,我就把其中一个项目的文件夹直接拷贝到电脑上,然后就出现了下面的情况. 这 ...
- JDK和SDK的区别:
参考链接:https://www.cnblogs.com/vaelailai/p/7976158.html jdk,是Java开发工具包,主要用于编写Java程序:也就是说你要使用Java语言,就需要 ...
- [LeetCode] 834. Sum of Distances in Tree
LeetCode刷题记录 传送门 Description An undirected, connected treewith N nodes labelled 0...N-1 and N-1 edge ...
- Java{0}占位符替换字符串
Java{0}占位符替换字符串 public class Test { public static void main(String[] args) { System.out.println(Stri ...
- docker搭建一个渗透测试环境 bwapp为例
bwapp是一个渗透测试靶场,他其中中含有100多个Web漏洞 基本涵盖了所有主要的已知Web漏洞,包括OWASP Top 10的各种 首先要去搜索一下 看一下有哪些镜像可以下载 docke ...
- 解决浏览器打开网页后提示“dns_probe_possible”的方法
使用浏览器浏览网页时偶尔会遇到无法上网且浏览器提示:DNS_PROBE_POSSIBLE 一般有三种情况会导致这样的故障: 1.网络协议出现故障,也就是常说的 DNS 设置问题 2.浏览器中设置问题, ...