UFLDL接听教程练习（来自编码器和矢量编程疏）

最近想在深入学习研究，开始看UFLDL(unsuprisedfeature learning and deep learning)教程了。特将课后习题答案放在这里，作为一个笔记。

笔记：

1：自编码算法是一个无监督学习算法。它通过学习h_w,b(x) = x,因此最后的outputlayer单元数与inputlayer单元数量相等，而中间的hiddenlayer能够非常大。这是加个稀疏惩处项，就相当于使中间非常多结点的激励值为0。这样就是类似于PCA了。算法就是反向传播，这里不做介绍。能够看教程！

2：可视化自编码器，习题中可视化的是W1，即须要学习的參数W1。

这个我不是非常理解，后来想了想，因为输入的是图像的一个个像素点，那么每个hidden
layer 如a₁⁽²⁾= w₁₁x1+w₁₂*x2+w13*x3+…，~~不太理解，接着学习后面的看。

练习答案：

1：稀疏自编码器

Step1：在sampleIMAGES.m文件里获取生成训练集的代码，当中tic和toc是用来记时用的。

tic

image_size=size(IMAGES);

i=randi(image_size(1)-patchsize+1,1,numpatches);   %产生1*10000个随机数 范围在[1,image_size(1)-patchsize+1]之间

j=randi(image_size(2)-patchsize+1,1,numpatches);

k=randi(image_size(3),1,numpatches);              % 随机的选取图片 10000次

for num=1:numpatches

        patches(:,num)=reshape(IMAGES(i(num):i(num)+patchsize-1,j(num):j(num)+patchsize-1,k(num)),1,patchsize*patchsize);

end

toc

Step2：在sparseAutoencoderCost.m文件里完毕前向传播和后向传播等相关代码

%1.forward propagation

data_size=size(data);           % [64, 10000]

active_value2=repmat(b1,1,data_size(2));    % 将b1扩展10000列 25*10000

active_value3=repmat(b2,1,data_size(2));    % 将b2扩展10000列 64*10000

active_value2=sigmoid(W1*data+active_value2);  %隐结点的值 矩阵表示全部的样本     25*10000 一列表示一个样本 hidden

active_value3=sigmoid(W2*active_value2+active_value3);   %输出结点的值 矩阵表示全部的样本  64*10000 一列表示一个样本 output

%2.computing error term and cost

ave_square=sum(sum((active_value3-data).^2)./2)/data_size(2);   %cost第一项  最小平方和

weight_decay=lambda/2*(sum(sum(W1.^2))+sum(sum(W2.^2)));         %cost第二项   全部參数的平方和 贝叶斯学派

p_real=sum(active_value2,2)./data_size(2);       % 稀疏惩处项中的预计p 为25维

p_para=repmat(sparsityParam,hiddenSize,1);       %稀疏化參数

sparsity=beta.*sum(p_para.*log(p_para./p_real)+(1-p_para).*log((1-p_para)./(1-p_real)));   %KL diversion

cost=ave_square+weight_decay+sparsity;      % 终于的cost function

delta3=(active_value3-data).*(active_value3).*(1-active_value3);      % 为error 是64*10000 矩阵表示全部的样本，每一列表示一个样本

average_sparsity=repmat(sum(active_value2,2)./data_size(2),1,data_size(2));  %求error中的稀疏项

default_sparsity=repmat(sparsityParam,hiddenSize,data_size(2));     %稀疏化參数

sparsity_penalty=beta.*(-(default_sparsity./average_sparsity)+((1-default_sparsity)./(1-average_sparsity

Step3：梯度检验

EPSILON=0.0001;

for i=1:size(theta)

    theta_plus=theta;

    theta_minu=theta;

    theta_plus(i)=theta_plus(i)+EPSILON;

    theta_minu(i)=theta_minu(i)-EPSILON;

    numgrad(i)=(J(theta_plus)-J(theta_minu))/(2*EPSILON);

end

Step4:可视化，训练train.m的时候，要将相关梯度校验相关代码去掉，由于这部分代码比較耗时间。

2：矢量化编程实现

这个仅仅须要在以上的代码中略做改动就可以。

Step1：首先将參数设置为

visibleSize = 28*28;   % number of input units

hiddenSize = 196;     % number of hidden units

sparsityParam = 0.1;   % desired average activation of the hidden units.

                     % (This was denoted by the Greek alphabet rho, which looks like a lower-case "p",

		     %  in the lecture notes).

lambda = 3e-3;     % weight decay parameter

beta = 3;            % weight of sparsity penalty term

Step2：将稀疏编码器中的step1获取训练集的方式换成以下代码：

images = loadMNISTImages('train-images.idx3-ubyte');

display_network(images(:,1:100)); % Show the first 100 images

patches = images(:, randi(size(images,2), 1, 10000));

这样就能够得到下面可视化的结果了：

UFLDL接听教程练习（来自编码器和矢量编程疏）的更多相关文章

矢量编程——随着MNIST案例
矢量编程使用的所有明确的矢量运算,而不是for周期. 上一节所用的是512*512*10的数据集非常小.我们取的patch非常小(8*8),学来的特征非常少(25).而我又凝视掉了梯度校验(偷懒),所 ...
Java NIO系列教程（八）JDK AIO编程
目录: Reactor(反应堆)和Proactor(前摄器) <I/O模型之三:两种高性能 I/O 设计模式 Reactor 和 Proactor> <[转]第8章前摄器(Proa ...
来自Unix/Linux的编程启发录
本篇文章已授权微信公众号 guolin_blog (郭霖)独家公布重点内容 2017年第一篇文章,祝各位好友新年快乐. 年前因为不小心坐到了自己左手大拇指导致轻微的骨裂,没有按时更新,实在是羞愧.今年 ...
MinGW安装图文教程以及如何配置C语音编程环境
MinGW安装图文教程以及如何配置C语音编程环境转载自:http://www.jb51.net/softjc/192017.html MinGW 是一组包含文件和端口库,其功能是允许控制台模式的程序 ...
UFLDL新版教程
http://ufldl.stanford.edu/tutorial/ 还带编程作业.
转+更新 Graphviz 教程,例子+ 高级应用写代码,编程绘制架构图(分层拓扑图) 转自官网
1. Graphviz介绍 Graphviz是大名鼎鼎的贝尔实验室的几位牛人开发的一个画图工具. 它的理念和一般的“所见即所得”的画图工具不一样,是“所想即所得”. Graphviz提供了dot语言来 ...
《C#并行编程高级教程》第9章异步编程模型笔记
这个章节我个人感觉意义不大,使用现有的APM(异步编程模型)和EAP(基于时间的异步模型)就很够用了,针对WPF和WinForm其实还有一些专门用于UI更新的类. 但是出于完整性,还是将一下怎么使用. ...
《C#并行编程高级教程》第2章命令式编程笔记
Parallel.Invoke 并行执行多个方法,只有在所有方法都执行后才会返回 static void Main(string[] args){ Parallel.Invoke( () ...
一些matlab教程资源收藏，使用matlab编程的人还是挺多的
Matlab教程专题资源免费下载整理合集收藏 <MATLAB从入门到精通>高清文字版[PDF] 103.9MB 简体中文 <矩阵实验室>(Mathworks.Matlab.R2 ...

随机推荐

【超有用】图解--怎样使用本地的dtd文件映射
曾经一直非常苦恼,假设电脑上不了网,就比較麻烦了.自己在配置HIbernate的属性的时候.不知道属性名有没有写错.. 如今和大家分享一下,毕竟自己痛苦过了,大家不要和我一样痛苦.
Java的内存泄漏和垃圾回收机制
JAVA会产生内存泄露吗?首先,答案是肯定的. Java尽管有垃圾回收器,但依旧存在泄漏. Java内存泄漏跟C/C++内存泄漏的概念不一样:C/C++的内存泄漏是指Malloc了一些资源.最后没有f ...
Oracle JDBC版本区别(转)
oracle\product\11.2.0\dbhome_1\jdbc\lib ojdbc5.jar ojdbc5dms.jar ojdbc5dms_g.jar ojdbc5_g.jar ojdbc6 ...
Deploy 11.2.0.3 RAC+DG on Windows 2008 R2 Step by Step
环境规划: 节点1: tc1 192.168.56.101 内存:2G 节点2: tc2 192.168.56.102 内存:2G 物理备库:tcdg192.168.56.108内存:1.5G 操作系 ...
Spring事务讲解示例(转)
Spring 事务Transaction1.事务的属性1.1 事务隔离IsolationLevel1.2 事务传播PropagationBehavior1.3 事务超时Timeout1.4 只读状态R ...
面向对象的方式进行数据交换网络之间的差异--无缝切换的发展到单机游戏C/S模式
上一页本文描述描述有关数据的发展过程之间的差异支撑点,这里展示的另一个特点:无缝切换的发展,以独立C/S模式一般C/S模式都面临一个问题: 就是开发过程中的调试难题,由于涉及到client和服务端相 ...
WPS2012交叉引用提示word比wps这种强烈的更新参考
WPS2012交叉引用技巧,word比wps这点强更新參考文献到时生成仅仅有有一条线,好像WPS不能够,word能够,假设谁知道能够补充.^_^ 1.写论文,參考文献的改动非 ...
NETSH WINSOCK RESET这个命令的意义和效果？
简要地netsh winsock reset命令含义复位 Winsock 文件夹.一机多用的假设Winsock协议配置问题,那么问题会导致网络连接,我们需要使用netsh winsock reset命 ...
UVA11100- The Trip, 2007
option=com_onlinejudge&Itemid=8&category=512&page=show_problem&problem=2041"> ...
POJ---2243 Knight Moves 使用A*算法的广度优先搜索
题目链接:http://poj.org/problem?id=2243 启发式搜索:启发式搜索就是在状态空间中的搜索对每一个搜索的位置进行评估,得到最好的位置,再从这个位置进行搜索直到目标.这样可以省 ...

UFLDL接听教程练习（来自编码器和矢量编程疏）

UFLDL接听教程练习（来自编码器和矢量编程疏）的更多相关文章

随机推荐

热门专题