机器学习： Softmax Classifier (三个隐含层)

程序实现 softmax classifier, 含有三个隐含层的情况。activation function 是 ReLU : f(x)=max(0,x)

f1=w1x+b1

h1=max(0,f1)

f2=w2h1+b2

h2=max(0,f2)

f3=w3h2+b3

h3=max(0,f3)

f4=w4h3+b4

y=ef4i∑jef4j



function Out=Softmax_Classifier_3(train_x,  train_y, opts)

% activation function RELU. y=max(0, x);

% setting learning parameters

step_size=opts.step_size;

reg=opts.reg;

batchsize = opts.batchsize;

numepochs = opts.numepochs;

K=opts.class;

h1=opts.hidden_1;

h2=opts.hidden_2;

h3=opts.hidden_3;

D=size(train_x, 2);

W1=0.01*randn(D, h1);

b1=zeros(1, h1);

W2=0.01*randn(h1,  h2);

b2=zeros(1, h2);

W3=0.01*randn(h2,  h3);

b3=zeros(1, h3);

W4=0.01*randn(h3, K);

b4=zeros(1, K);

loss(1 : numepochs)=0;

num_examples=size(train_x, 1);

numbatches = num_examples / batchsize;

for epoch=1:numepochs

     kk = randperm(num_examples);

     loss(epoch)=0;

     tic;

      sprintf('epoch %d:  \n' , epoch)

     for bat=1:numbatches

         batch_x = train_x(kk((bat - 1) * batchsize + 1 : bat * batchsize), :);

         batch_y = train_y(kk((bat - 1) * batchsize + 1 : bat * batchsize), :);

         %% forward

         f1=batch_x*W1+repmat(b1, batchsize, 1);

         hiddenval_1=max(0, f1);

         f2=hiddenval_1*W2+repmat(b2, batchsize, 1);

         hiddenval_2=max(0, f2);

         f3=hiddenval_2*W3+repmat(b3, batchsize, 1);

         hiddenval_3=max(0, f3);

         scores=hiddenval_3*W4+repmat(b4, batchsize, 1);

         %% the loss

         exp_scores=exp(scores);

         dd=repmat(sum(exp_scores, 2), 1, K);

         probs=exp_scores./dd;

         correct_logprobs=-log(sum(probs.*batch_y, 2));

         data_loss=sum(correct_logprobs)/batchsize;

         reg_loss=0.5*reg*sum(sum(W1.*W1))+0.5*reg*sum(sum(W2.*W2))+0.5*reg*sum(sum(W3.*W3))+0.5*reg*sum(sum(W4.*W4));

         loss(epoch) =loss(epoch)+ data_loss + reg_loss;

         %% back propagation

         % output layer

         dscores = probs-batch_y;

         dscores=dscores/batchsize;

         dW4=hiddenval_3'*dscores;

         db4=sum(dscores);

         % hidden layer 3

         dhiddenval_3=dscores*W4';

         mask=max(sign(hiddenval_3), 0);

         df_3=dhiddenval_3.*mask;

         dW3=hiddenval_2'*df_3;

         db3=sum(df_3);

         % hidden layer 2

         dhiddenval_2=df_3*W3';

         mask=max(sign(hiddenval_2), 0);

         df_2=dhiddenval_2.*mask;

         dW2=hiddenval_1'*df_2;

         db2=sum(df_2);

         % hidden layer 1

         dhiddenval_1=df_2*W2';

         mask=max(sign(hiddenval_1), 0);

         df_1=dhiddenval_1.*mask;

         dW1=batch_x'*df_1;

         db1=sum(df_1);

         %% update

         dW4=dW4+reg*W4;

         dW3=dW3+reg*W3;

         dW2=dW2+reg*W2;

         dW1=dW1+reg*W1;

         W4=W4-step_size*dW4;

         b4=b4-step_size*db4;

         W3=W3-step_size*dW3;

         b3=b3-step_size*db3;

         W2=W2-step_size*dW2;

         b2=b2-step_size*db2;

         W1=W1-step_size*dW1;

         b1=b1-step_size*db1;

     end

     loss(epoch)=loss(epoch)/numbatches;

     sprintf('training loss is  %f:  \n', loss(epoch))

    toc;

end

Out.W1=W1;

Out.W2=W2;

Out.W3=W3;

Out.W4=W4;

Out.b1=b1;

Out.b2=b2;

Out.b3=b3;

Out.b4=b4;

Out.loss=loss;

机器学习： Softmax Classifier (三个隐含层)的更多相关文章

机器学习：Softmax Classifier (两个隐含层)
程序实现 softmax classifier, 含有两个隐含层的情况.activation function 是 ReLU : f(x)=max(0,x) f1=w1x+b1 h1=max(0,f1 ...
机器学习 Softmax classifier (一个隐含层)
程序实现 softmax classifier, 含有一个隐含层的情况.activation function 是 ReLU : f(x)=max(0,x) f1=w1x+b1 h1=max(0,f1 ...
机器学习 Softmax classifier (无隐含层)
程序实现 Softmax classifer, 没有隐含层, f=wx+b y=efi∑jefj %% Softmax classifier function Out=Softmax_Classifi ...
python机器学习实战（三）
python机器学习实战(三) 版权声明:本文为博主原创文章,转载请指明转载地址 www.cnblogs.com/fydeblog/p/7277205.html 前言这篇notebook是关于机器 ...
基于MNIST数据集使用TensorFlow训练一个包含一个隐含层的全连接神经网络
包含一个隐含层的全连接神经网络结构如下: 包含一个隐含层的神经网络结构图以MNIST数据集为例,以上结构的神经网络训练如下: #coding=utf-8 from tensorflow.exampl ...
基于MNIST数据集使用TensorFlow训练一个没有隐含层的浅层神经网络
基础在参考①中我们详细介绍了没有隐含层的神经网络结构,该神经网络只有输入层和输出层,并且输入层和输出层是通过全连接方式进行连接的.具体结构如下: 我们用此网络结构基于MNIST数据集(参考②)进行训 ...
理解dropout——本质是通过阻止特征检测器的共同作用来防止过拟合 Dropout是指在模型训练时随机让网络某些隐含层节点的权重不工作，不工作的那些节点可以暂时认为不是网络结构的一部分，但是它的权重得保留下来（只是暂时不更新而已），因为下次样本输入时它可能又得工作了
理解dropout from:http://blog.csdn.net/stdcoutzyx/article/details/49022443 http://www.cnblogs.com/torna ...
ubuntu之路——day13 只用python的numpy在较为底层的阶段实现单隐含层神经网络
首先感谢这位博主整理的Andrew Ng的deeplearning.ai的相关作业:https://blog.csdn.net/u013733326/article/details/79827273 ...
MLP神经网络隐含层节点数的设置】如何设置神经网络隐藏层的神经元个数
神经网络隐含层节点数的设置]如何设置神经网络隐藏层的神经元个数置顶 2017年10月24日 14:25:07 开心果汁阅读数:12968 版权声明:本文为博主原创文章,未经博主允许不得转 ...

随机推荐

在 Android* 商务应用中实施地图和地理围栏特性
摘要本案例研究讨论了怎样将地图和地理定位特性构建到 Android* 商务应用中.包含在 Google Maps* 上覆盖商店位置,以及在设备进入商店地理围栏邻近区域时借助地理围栏通知用户. 文件夹 ...
深入理解HTTP协议及原理分析之缓存（3种缓存机制）
3.2 缓存的实现原理 3.2.1什么是Web缓存 WEB缓存(cache)位于Web服务器和客户端之间. 缓存会根据请求保存输出内容的副本,例如html页面,图片,文件,当下一个请求来到的时候:如果 ...
html5 audio标签相关知识点总结
1.audio指JS原生对象,假如用jquery获取到audio标签后,需要dom[0]转为原生JS对象 if(audio.paused){ //如果音频暂停,就播放 audio.play(); }e ...
有关Canvas的一点小事—图像绘制
1. 使用canvas绘制图像什么是图像?在js中它就是一个<img src=””>,<img>有两种接收图像信息的方法,一个是直接链接到图像地址,一个使用base64数据 ...
document.write的注意点
如果给button点击事件添加document.write会消除页面所有元素,包括button按钮 <!DOCTYPE html> <html> <head> &l ...
Codeforces #144 (Div. 1) B. Table (组合数学+dp)
题目链接: B.Table 题意: \(n*m\)的矩阵使每个\(n*n\)矩阵里面准确包含\(k\)个点,问你有多少种放法. \((1 ≤ n ≤ 100; n ≤ m ≤ 10^{18}; 0 ≤ ...
Source Insight 3.50.0065使用详解
转自calvinlee1984 Subject:Source Insight3.50.0065使用详解 Date: 21-Oct-2011 By: Calvinlee1984@ ...
(转)利用openfiler实现iSCSI
转自:http://czmmiao.iteye.com/blog/1735417 openfiler openfiler是一个基于浏览器的网络存储管理工具.来自于Linux系统.openfiler在一 ...
10.9 android输入系统_APP跟输入系统建立联系和Dispatcher线程_分发dispatch
12. 输入系统_APP跟输入系统建立联系_InputChannel和Connection核心: socketpair // 第9课第3节_输入系统_必备Linux编程知识_任意进程双向通信(scok ...
8.1 Android灯光系统_总体框架
1.框架 APP(java语言实现) ------------------------------- JNI(c++语言实现) 向上提供Java执行c函数的接口向下访问HAL ------ ...

机器学习： Softmax Classifier (三个隐含层)

机器学习： Softmax Classifier (三个隐含层)的更多相关文章

随机推荐

热门专题