《Neural Network and Deep Learning》

《Neural Network and Deep Learning》_chapter4: A visual proof that neural nets can compute any function文章总结(前三章翻译在百度云里)

链接：http://neuralnetworksanddeeplearning.com/chap4.html；

Michael Nielsen的《Neural Network and Deep Learning》教程中的第四章主要是证明神经网络可以用来表示任何一种函数映射

现在对这篇文章进行一下梳理：作者首先提出了两点注意：

（1）神经网络并不是给出函数映射的一个准确的结果，而是一个近似值；

（2）神经网络表示的一种连续函数映射，无法实现非连续的函数映射。

然后作者开始证明神经网络的这种性质的普遍性，

（一）单输入/单输出的情况着手开始证明：

上图，权值是8，阈值是-4，激活函数为sigmoid函数。隐藏层的输出近似为右图，当我们令权值w足够大时，隐藏层神经元的输出近似为阶跃函数，如下：

上图中，阶跃位置s=-b/w,现证明如下：

设阶跃位置是A点，则

并且我们有如下结论：改变阈值使输出曲线平移，改变权值会使图像陡峭/平滑；

之所以我们在这里要使隐藏层神经元的输出近似为阶跃函数，是因为这样神经元的输出不是0就是1，这样再传到输出层计算误差小，更加拟合期望的函数映射，而如果是S型曲线，则计算误差大，难以拟合期望的输出曲线（这里是我自己的理解，欢迎讨论）

上图中，阶跃位置分别为s1=0.4,s2=0.6,阶跃函数的最终值分别为0.6和1.2,所以最终的输出曲线如右图，这里改变s1和s2的位置即改变了神经元们被激活的顺序，这样也就改变了输出的形状；

上图中令w1=-w2=0.8,输出即为高为0.8的bump 函数（肿块函数），从0.4到0.6；

上图中的输出还可以用下图的"if-then-else"来解释：

即x>阶跃位置，则输出为1，反之为0；

增加隐藏层神经元的数目，就可以n个这样的bump函数来近似我们想要的函数映射，如下：

类似于微积分的原理。。。。

我们的目的就是设计这样一种神经网络使实际输出与期望的函数映射之间的平均误差最小化；

我们可以使用上面的方法实现任何一种[0,1]到[0,1]的映射（我觉得应该不限于[0,1]到[0,1]的映射）；

（二）对于多输入时普遍性的证明：

先从两个输入时的情况着手：

上图中连接x的权值足够大，连接y的权值为0，隐藏层神经元的阶跃位置为0.5，上图中的曲线只会在x方向上进行移动（隐藏层神经元上方的x表示移动的方向为x方向）；类似地，令连接y的权值足够大，连接x的权值为0，则输出曲线只会在Y方向上移动；

上图中，plateau(平台)的高为h,中心tower(塔)的高为2h(h+h)，我们需要实现下面这种tower function:

再参考之前的"if-then-else"法则我们有：

这里令threshold为3h/2，则plateau的值变为0，中心tower的值变为1.从而可获得tower function.而实际操作时我们可以这样做：

加入阈值b和sigmoid激活函数：

想要获得tower函数，我们一般令h足够大，b为（-m+0.5）h(经验值)，其中m是输入变量的个数：

后面的Problem这里只证明(a),另外两题略；

证明神经网络的普遍性之后，作者关于sigmoid函数又做了一些额外说明：

（1）线性激活函数无法实现上面的普遍性，因为它无法实现阶跃函数那样的形状；

（2）作者在这儿提到了Failure Windows一概念，即下图中的绿色部分：

我们的目的就是令Failure Windows尽可能的小，一种方法就是用M个σ^-1°f(x)/M函数进行叠加，M越大，Failure Windows就会变得更狭窄。

《Neural Network and Deep Learning》_chapter4的更多相关文章

【DeepLearning学习笔记】Coursera课程《Neural Networks and Deep Learning》——Week2 Neural Networks Basics课堂笔记
Coursera课程<Neural Networks and Deep Learning> deeplearning.ai Week2 Neural Networks Basics 2.1 ...
【DeepLearning学习笔记】Coursera课程《Neural Networks and Deep Learning》——Week1 Introduction to deep learning课堂笔记
Coursera课程<Neural Networks and Deep Learning> deeplearning.ai Week1 Introduction to deep learn ...
《Neural Networks and Deep Learning》课程笔记
Lesson 1 Neural Network and Deep Learning 这篇文章其实是 Coursera 上吴恩达老师的深度学习专业课程的第一门课程的课程笔记. 参考了其他人的笔记继续归纳 ...
neural network and deep learning笔记（1）
neural network and deep learning 这本书看了陆陆续续看了好几遍了,但每次都会有不一样的收获. DL领域的paper日新月异.每天都会有非常多新的idea出来,我想.深入 ...
Neural Network Programming - Deep Learning with PyTorch with deeplizard.
PyTorch Prerequisites - Syllabus for Neural Network Programming Series PyTorch先决条件 - 神经网络编程系列教学大纲每个 ...
Neural Network Programming - Deep Learning with PyTorch - YouTube
百度云链接: 链接:https://pan.baidu.com/s/1xU-CxXGCvV6o5Sksryj3fA 提取码:gawn
Reading | 《DEEP LEARNING》
目录一.引言 1.什么是.为什么需要深度学习 2.简单的机器学习算法对数据表示的依赖 3.深度学习的历史趋势最早的人工神经网络:旨在模拟生物学习的计算模型神经网络第二次浪潮:联结主义connec ...
课程一(Neural Networks and Deep Learning)，第四周（Deep Neural Networks） —— 3.Programming Assignments: Deep Neural Network - Application
Deep Neural Network - Application Congratulations! Welcome to the fourth programming exercise of the ...
《Deep Learning》(深度学习)中文版PDF免费下载
<Deep Learning>(深度学习)中文版PDF免费下载 "深度学习"经典著作<Deep Learning>中文版pdf免费下载. <Deep ...

随机推荐

关于pc端直播
写这篇文章首先是想给自己一个总结.整理,还有就是给那些没有特别明白直播是怎么回事的人一点思路最近公司想要做pc端直播,作为一个自认为很菜的前端实在是不知从何下手,所以只能用国人最爱的百度,搜索了 ...
企业SOA架构设计理论
SOA简介 SOA(Service-Oriented Architecture,面向服务架构)是一种将信息系统模块化为服务的架构风格.拥有了服务之后,我们就可以迅速地将这些服务按不同方式重新组合,从而 ...
linux安装nexus
一.下载nexus 最新地址在:https://www.sonatype.com/download-oss-sonatype 我下载的是:nexus-2.14.1-01-bundle.tar.gz,是 ...
x509数字证书导入-然后删除自身
这种程序的使用场景,需要给客户一个证书,但不能把证书直接给他让他安装,程序中需要用到给客户的私钥,但又不允许客户将这个证书再去授权给其它人. 重点并不是代码,是如何对用户隐藏需要添加的资源 ,以文本为 ...
CTRL-Space always toggles Chinese IME (Windows 7、10)
一.window占用了ctrl+空格的快捷键,影响开发工具的只能提示的使用. 二.解决方式: Go to Start > Type in regedit and start it (打开运行输入 ...
bzoj2330: [SCOI2011]糖果
2330: [SCOI2011]糖果 Time Limit: 10 Sec Memory Limit: 128 MB Description 幼儿园里有N个小朋友,lxhgww老师现在想要给这些小朋友 ...
iOS －滑屏方案
参考自:iOS开发- 通过ChildViewCotroller ViewController容器产品增加新的版面,类似于网易新闻,百度新闻,腾讯新闻等新闻客户端首页多屏幕滑屏切换,找了一些开源代码研 ...
Spring（Model）
一个轻量级的控制反转(IoC)和面向切面(AOP)的容器框架分层架构,一站式(full-stack),高内聚低耦合,允许客户端JavaScript远程调用服务端JAVA类方法应用中的对象不依赖于S ...
使用QQ第三方登录时,手机应用和网站应用对同一个QQ号,获取到的openid不一样
使用QQ第三方登录时,手机应用和网站应用对同一个QQ号,获取到的openid不一样openid生成是根据应用的appid和QQ号的一些信息加密生成,对于一个appid和QQ号来说,openid是唯一的 ...
[Exchange 2013]创建约会和会议
简介会议和约会之间的重要区别是,会议有与会者,并且没有约会.约会和会议可以是单实例或属于重复序列,但与会者. 房间或资源中不包括约会,因为它们不需要发送一条消息.在内部,Exchange 使用相同的 ...

《Neural Network and Deep Learning》_chapter4

《Neural Network and Deep Learning》_chapter4的更多相关文章

随机推荐

热门专题