神经网络(14)--具体实现:put it together

如何选择神经网络的architecture

input units和output units都很好决定，关于hidden layer的层数，则一般来说是选择一个hidden layer, 或者>1的hidden layer,但是每个hidden layer都有相同的units.通常来说hidden layer的units的数目是input units--3/4*input units之间，比input units稍微多一点。

如果是多分类的问题，则y的值如上图所示是一个向量，而不是logistic regression问题中的一个正数。

Trainning a neural network

weights是接近于0的随机数。

我们用一个for循环，对第一个样本进行forward propagation和backpropagation，再对第二个样本进行forward propagation和backpropagation直到最后一个样本。这样我们就得到了a^(l)和δ^(l),接下来我们可以计算Δ^(l),对Δ^(l)进行累加（可详见前面的介绍），这个Δ^(l)累加完成后在循环外面用来计算偏导.

back propagation算法是用来计算J(Θ)的偏导的，这样可以用来求J(Θ)的最小值。

在神经网络中，J(Θ)是non-convex函数，即我们求的最小值只是局部最优解，不是全局的，但是这并没有关系，因为gradient descent以及一些advanced optimization method求得的最小值已经很好了。

求最优点的图

上面这个图只画出了两个参数的情况，实际上我们有很多个参数，但是为了能画出图像的目的，这里只是给出两个参数的图像做为例子。

左下角的那个点对应的J(Θ)的值很小，即对我们的训练数据进行了很好的模拟。右上角的那个点对应的J(Θ)的值较大，即h_Θ(x⁽ⁱ⁾)远离y⁽ⁱ⁾.

当我们做梯度下降算法时，先从某一点开始，由back propagation来决定下降的方向，这样一步步下降接近局部最优解。

神经网络(14)--具体实现:put it together的更多相关文章

机器学习公开课笔记(4)：神经网络(Neural Network)——表示
动机(Motivation) 对于非线性分类问题,如果用多元线性回归进行分类,需要构造许多高次项,导致特征特多学习参数过多,从而复杂度太高. 神经网络(Neural Network) 一个简单的神经网 ...
论文翻译：Data mining with big data
原文: Wu X, Zhu X, Wu G Q, et al. Data mining with big data[J]. IEEE transactions on knowledge and dat ...
Improved robustness of reinforcement learning policies upon conversion to spiking neuronal network platforms applied to Atari Breakout game
郑重声明:原文参见标题,如有侵权,请联系作者,将会撤销发布! arXiv:1903.11012v3 [cs.LG] 19 Aug 2019 Neural Networks, 25 November 2 ...
机器学习入门14 - 神经网络简介 (Introduction to Neural Networks)
原文链接:https://developers.google.com/machine-learning/crash-course/introduction-to-neural-networks/ 神经 ...
Stanford CS231n实践笔记（课时14卷积神经网络详解上）
本课我们主要来研究一个"浏览器中的卷积神经网络" 这只是一个展示项目,但是能够帮助直观地看到一些东西地址:https://cs.stanford.edu/people/karpa ...
[DeeplearningAI笔记]卷积神经网络4.1-4.5 人脸识别/one-shot learning/Siamase网络/Triplet损失/将面部识别转化为二分类问题
4.4特殊应用:人脸识别和神经网络风格转换觉得有用的话,欢迎一起讨论相互学习~Follow Me 4.1什么是人脸识别 Face verification人脸验证 VS face recogniti ...
Python图像处理（14）：神经网络分类器
快乐虾 http://blog.csdn.net/lights_joy/ 欢迎转载,但请保留作者信息在opencv中支持神经网络分类器.本文尝试在python中调用它. 和前面的贝叶斯分类器一样.神 ...
BP神经网络原理及python实现
[废话外传]:终于要讲神经网络了,这个让我踏进机器学习大门,让我读研,改变我人生命运的四个字!话说那么一天,我在乱点百度,看到了这样的内容: 看到这么高大上,这么牛逼的定义,怎么能不让我这个技术宅男心 ...
转--脉络清晰的BP神经网络讲解，赞
http://www.cnblogs.com/wengzilin/archive/2013/04/24/3041019.html 学习是神经网络一种最重要也最令人注目的特点.在神经网络的发展进程中, ...

随机推荐

java中的Stream流
java中的Stream流说到Stream便容易想到I/O Stream,而实际上,谁规定"流"就一定是"IO流"呢?在Java 8中,得益于Lambda所带 ...
Java的集合类之 List 接口用法
集合其实在本质上面就是数据结构,它封装了一些底层的数据结构等操作进行操作. 集合的长度是可变的,用来存放对象的引用.常见的集合类有List集合.Set集合.Map集合. 1. List接口 List是 ...
PHP_MySQL高并发加锁事务处理
1.背景: 现在有这样的需求,插入数据时,判断test表有无username为‘mraz’的数据,无则插入,有则提示“已插入”,目的就是想只插入一条username为‘mraz’的记录. 2.一般程序 ...
controller进行数据保存以及作用域
controller进行数据保存以及作用域一.request域 1.ModelAndView 在ModelAndView中进行存键值对,也可以进行跳转的地址存储,但是返回类型必须是ModelAndV ...
CSP前的板子们
见窝的luogu博客qwq noip前的板子们
array_walk、array_map、array_filter 的用法
array_walk.array_map.array_filter 和 foreach 都有循环对数组元素进行处理的功能. 一.array_walk 用法 1.循环数组,回调处理(并不修改数组元素的 ...
Modelsim——工程建立和常用设置
Modelsim是一款优秀的FPGA仿真软件,这里记录一下Modelsim的基本使用. 一.联合仿真联合仿真,即Quartus ii自己调用Modelsim,Modelsim自动出现仿真波形. 1. ...
Xshell连接虚拟机文档教程
1打开VirtualBox 2 找到导入的虚拟机 3右键虚拟机启动 4 等待加载 5 加载的时候,打开xshell 6 7 填写框住的内容名称: 自己取主机: 127.0.0.1 固定内容端 ...
VirtualBox导入OVA文件文档教程
1 2 修改框住的路径,最好不要在C盘 3 取消检查更新 4 5 6 7 8 9 10 11 等待加载完成:加载完成后 OVA文件导入成功作者:含笑半步颠√ 博客链接:https://www.cnb ...
[LOJ2065] [SDOI2016]模式字符串
题目链接洛谷:https://www.luogu.org/problemnew/show/P4075 LOJ:https://loj.ac/problem/2065 Solution 这种题看起来就 ...

神经网络(14)--具体实现:put it together

神经网络(14)--具体实现:put it together的更多相关文章

随机推荐

热门专题