深度学习笔记——PCA原理与数学推倒详解

　　PCA目的：这里举个例子，如果假设我有m个点，{x(1),...,x(m)}，那么我要将它们存在我的内存中，或者要对着m个点进行一次机器学习，但是这m个点的维度太大了，如果要进行机器学习的话参数太多，或者说我要存在内存中会占用我的较大内存，那么我就需要对这些个点想一个办法来降低它们的维度，或者说，如果把这些点的每一个维度看成是一个特征的话，我就要减少一些特征来减少我的内存或者是减少我的训练参数。但是要减少特征或者说是减少维度，那么肯定要损失一些信息量。这就要求我在减少特征或者维度的过程当中呢，尽可能少的损失信息量，这就是PCA算法的目的。

　　也就是说，对于我的每一个点我要找到一个新的表达形式，也相当于找到一个函数，让f(x)=c。

　　对于恢复来说，我们这里选择最简单的矩阵相乘的形式让我们的新的表达c变回n维。即，这里。

　　这里我们加一个约束，那就是D的列向量互相时间是正交的（注意：如果不是l=n的情况，D是不能说成是正交矩阵的）。

　　接下来我们就要将我们的想法转变为可以实施的算法了。

　　我们都知道在机器学习中，有一种函数叫做代价函数，英文是cost function，这个函数的作用就是用来评估你模型的输入和输出之间的差距的。如果你的模型输出和输入的差距越大，这个cost function的值就越大。

　　我们借用这样一个思想，如果我要找到一个可以尽可能损失信息的c的表达，那我就让g(c)尽可能的和x相同，也就是构造了一个代价函数，我们的目的就是让这个代价函数的值变成最小。数学表达式如下：

　　我们这里将这个欧几里得距离加上一个平方，我的理解是方便计算，反正增减性啊都是一样的。

　　那我们的表达式就变成了这样：

　　等式右边这一项等于：

　　这里是因为x和g(c)都是n维向量，的结果是一个标量，就是一个数，转置自然等于自身啦。

　　那么现在我们的问题变成了这样：

　　然后我们把g(c)带入公式中：

　　还记得D的约束吗？D的列向量相互之间是正交的，所以D^TD=I。

　　那么到现在为止，我就可以得到我这个式子的结果了，对上面这个表达式对C求导：

　　现在我们发现，要想对x进行PCA处理，我们只需要找到这个矩阵D，然后让它的转置乘以X就好了。

　　即PCA和解码的过程就是：

　　那么现在我们来算这个矩阵D。

　　还是根据代价函数的思想，我们得到了上述公式。

　　为了得到这个算法，我们首先考虑最简单的l=1的情况。也就是说，D中只包含了一个向量d。

　　这样我们得到：

　　我们将这个公式美化一下：

　　然后我们将所有的x点都带入进去，统一用X表达，X就是一个m*n的矩阵。

　　经过一个等价变化我们得到了有关于矩阵的迹的表达式：

　　这中间我们去掉了与d无关的项。

　　然后我们进行一下化简：

　　那现在这个问题就可以根据特征值来求解了。得到的d就是X^TX的最大的特征值对应的特征向量。

　　那么对于l>1的情况，DD就是最大l个特征值对应的特征向量的组合。

　　参考自：Deep Learning 。作者：Yoshua Bengio, Ian Goodfellow, Aaron Courville

深度学习笔记——PCA原理与数学推倒详解的更多相关文章

Linux防火墙iptables学习笔记（三）iptables命令详解和举例[转载]
Linux防火墙iptables学习笔记(三)iptables命令详解和举例 2008-10-16 23:45:46 转载网上看到这个配置讲解得还比较易懂,就转过来了,大家一起看下,希望对您工作能 ...
基于OpenCL的深度学习工具：AMD MLP及其使用详解
基于OpenCL的深度学习工具:AMD MLP及其使用详解 http://www.csdn.net/article/2015-08-05/2825390 发表于2015-08-05 16:33| 59 ...
(转)live555学习笔记10－h264 RTP传输详解(2)
参考: 1,live555学习笔记10-h264 RTP传输详解(2) http://blog.csdn.net/niu_gao/article/details/6936108 2,H264 sps ...
学习笔记--Grunt、安装、图文详解
学习笔记--Git安装.图文详解安装Git成功后,现在安装Gruntjs,官网:http://gruntjs.com/ 一.安装node 参考node.js 安装.图文详解 (最新的node会自动安 ...
Pytorch学习笔记08----优化器算法Optimizer详解（SGD、Adam）
1.优化器算法简述首先来看一下梯度下降最常见的三种变形 BGD,SGD,MBGD,这三种形式的区别就是取决于我们用多少数据来计算目标函数的梯度,这样的话自然就涉及到一个 trade-off,即参数更 ...
lucene学习笔记（四）lucene分词详解
分词器的核心类 Analyzer SimpleAnalyzer StopAnalyzer WhitespaceAnalyzer StandardAnalyzer TokenStream 分词器做好处理 ...
JQuery学习笔记系列（一）----选择器详解
笔者好长时间没有更新过博客园的笔记了,一部分原因是去年刚刚开始工作一段时间忙碌的加班,体会了一种每天加班到凌晨的充实感,之后闲暇时间了也因为自己懒惰没有坚持记笔记的习惯,现在重新拾起来. 借用古人的一 ...
【Java学习笔记之三十四】超详解Java多线程基础
前言多线程并发编程是Java编程中重要的一块内容,也是面试重点覆盖区域,所以学好多线程并发编程对我们来说极其重要,下面跟我一起开启本次的学习之旅吧. 正文线程与进程 1 线程:进程中负责程序执行的 ...
【精选】Nginx模块Lua-Nginx-Module学习笔记（二）Lua指令详解(Directives)
源码地址:https://github.com/Tinywan/Lua-Nginx-Redis Nginx与Lua编写脚本的基本构建块是指令. 指令用于指定何时运行用户Lua代码以及如何使用结果. 下 ...

随机推荐

jpa+springdata
学习爱酷学习网尚硅谷springdata笔记: 1.在 Spring 配置文件 <?xml version="1.0" encoding="UTF-8"? ...
[LeetCode] Best Meeting Point 最佳开会地点
A group of two or more people wants to meet and minimize the total travel distance. You are given a ...
Django ORM、一对一、一对多、多对多、详解
上篇博客也提到这些知识点,可能大家还是不太清楚,这篇博客为大家详细讲解ORM中的几个知识点 1.1首先我们先看一个小案例: #_*_coding:utf-8_*_ from django.db imp ...
贝塔阶段html及pdf模块测试
这次虽然工作内容是将c#的html及pdf处理程序移植到java中,但是由于重新编写代码使得先前的工作成果得不到利用,于是将其编写为dll,再在java端调用. 这使得在java端即便每个分支都到达, ...
svn服务器地址变换以后，mac下的处理方法
svn服务器地址变换之后,mac下的处理方法 svn服务器地址变换之后,mac下的处理方法 1.进入终端,进入项目所在的文件夹下: cd 项目位置/ 2.查看svn信息 svn info 3.输出结果 ...
Android Studio JNI 开发简单案例
转载:http://www.androidchina.net/5744.html 进程保活,热修复,硬件接入等等都需要底层的支持,而底层代码是 C .C++ 写的,那么在 Android 中怎么调用底 ...
ReactNative 根据scrollView/listview滑动距离动态修改NavBar颜色
我们常见某些APP上滑的时候,NavBar颜色会从透明渐变为某种颜色原理非常简单,根据scrollView的回调动态修改NavBar的透明度即可. 在RN中,尤其是ListView中这个回调不是很好 ...
发送ajax请求时页面被刷新
浏览器默认会认为 button 的属性是submit.type='submit',会发生提交表单的默认行为,为button添加type="button"即可.
Python 3.5源码编译安装
系统环境:CentOS 6.8-Minimal 安装Python依赖包: [root@Python src]# yum install zlib-devel bzip2-devel openssl-d ...
Windows常用快捷方式
总结了其他常用的快捷方式: Ctrl+C 复制 . Ctrl+V粘贴. Ctrl+X剪切. Delete删除. Alt+Tab 应用程序切换 Ctrl+Alt+Delete Ctrl+shift+E ...

深度学习笔记——PCA原理与数学推倒详解

深度学习笔记——PCA原理与数学推倒详解的更多相关文章

随机推荐

热门专题