神经网络与深度学习笔记 Chapter 3.

　　交叉熵

　　交叉熵是用于解决使用二次代价函数时当单个神经元接近饱和的时候对权重和bias权重学习的影响。这个公式可以看出，当神经元饱和的时候，sigma的偏导接近于0，w的学习也会变小。但是应用交叉熵作为代价函数的话，只有当所有的神经元接近0或者1的时候才会出现这种情况。它解决了初始化w和bias时坏的w和bias带来的影响。

　　　交叉熵对w求偏导：

　　　　，，，，有

　　　最后得出:　由该公式可以看出，只有大部分样例的输出接近期望值时，w的学习才会变缓。bias同理。

上面的讨论只针对有一个神经元的网络。

如果代价函数是交叉熵函数，那么对应的BP1为:BP4为，可以看出，该公式中消除了delta对z的偏导。

但是，对于线性神经元且，二次代价函数的误差为，从而有：

这说明当神经元是线性的时候，就不存在学习率下降的情况了。与此同时，这个时候神经元的误差可以称为是a与期望值的差。

Overfitting and regularization

过度拟合在神经网络中的表现是，当训练周期太长时，对测试集的准确率一直在摇摆，而训练集的损失（cost）在一直降低，这个时候就相当于网络在记住训练集中的特性，而不是进行更具一般性的学习。所以我们需要知道过拟合什么时候发生，学习降低过拟合的影响的技术。

一般来说减少过拟合的方法之一就是增加训练集的大小，但是有时候训练数据的获取并不是那么容易。

另一个减少过拟合的方法是正则化，本章将讲述正则化技术的一种权重衰减（weight decay)或L2正则化。该方法是添加一个正则项（regularization term)到损失函数中，添加正则项的损失函数如下所示：

　　　　　　或

其中叫做正则化参数( regularization parameter)，而n一般是训练集的大小，注意正则项中不包含bias。

神经网络与深度学习笔记 Chapter 3.的更多相关文章

神经网络与深度学习笔记 Chapter 6之卷积神经网络
深度学习 Introducing convolutional networks:卷积神经网络介绍卷积神经网络中有三个基本的概念:局部感受野(local receptive fields), 共享权重 ...
神经网络与深度学习笔记 Chapter 1.
转载请注明出处:http://www.cnblogs.com/zhangcaiwang/p/6875533.html sigmoid neuron 微小的输入变化导致微小的输出变化,这种特性将会使得学 ...
神经网络与深度学习笔记 Chapter 2.
转载请注明出处http://www.cnblogs.com/zhangcaiwang/p/6886037.html 以前都没有正儿八经地看过英文类文档,神经网络方面又没啥基础,结果第一章就花费了我将近 ...
UFLDL深度学习笔记（六）卷积神经网络
UFLDL深度学习笔记 (六)卷积神经网络 1. 主要思路 "UFLDL 卷积神经网络"主要讲解了对大尺寸图像应用前面所讨论神经网络学习的方法,其中的变化有两条,第一,对大尺寸图像 ...
Deeplearning.ai课程笔记-神经网络和深度学习
神经网络和深度学习这一块内容与机器学习课程里Week4+5内容差不多. 这篇笔记记录了Week4+5中没有的内容. 参考笔记:深度学习笔记神经网络和深度学习结构化数据:如数据库里的数据非结构化数 ...
[DeeplearningAI笔记]神经网络与深度学习人工智能行业大师访谈
觉得有用的话,欢迎一起讨论相互学习~Follow Me 吴恩达采访Geoffrey Hinton NG:前几十年,你就已经发明了这么多神经网络和深度学习相关的概念,我其实很好奇,在这么多你发明的东西中 ...
Google TensorFlow深度学习笔记
Google Deep Learning Notes Google 深度学习笔记由于谷歌机器学习教程更新太慢,所以一边学习Deep Learning教程,经常总结是个好习惯,笔记目录奉上. Gith ...
深度学习笔记：优化方法总结(BGD,SGD,Momentum,AdaGrad,RMSProp,Adam)
深度学习笔记:优化方法总结(BGD,SGD,Momentum,AdaGrad,RMSProp,Adam) 深度学习笔记(一):logistic分类深度学习笔记(二):简单神经网络,后向传播算法及实现 ...
UFLDL深度学习笔记（一）反向传播与稀疏自编码
UFLDL深度学习笔记 (一)基本知识与稀疏自编码前言近来正在系统研究一下深度学习,作为新入门者,为了更好地理解.交流,准备把学习过程总结记录下来.最开始的规划是先学习理论推导:然后学习一两种开源 ...

随机推荐

阿里云服务器通过JavaMail发送邮箱STMP问题（ 25端口被禁用使用SSL协议465端口）
我们传统使用的比较简单的是 STMP 25端口收发邮件今天发现刚购买的阿里云服务器不能作为客户端通过STMP 25端口发送邮件开始在网上有说发现是JDK1.8的原因,然后自己也把JDK1.8换到了 ...
Python爬虫从入门到放弃（十一）之 Scrapy框架整体的一个了解
这里是通过爬取伯乐在线的全部文章为例子,让自己先对scrapy进行一个整理的理解该例子中的详细代码会放到我的github地址:https://github.com/pythonsite/spider ...
PHP中定义常量define与const
我们通常把不经常变的值定义成常量,常量一般用全部大写来表示,前面不加美元符号,也可减少团队开发的出错.那么define和const有什么区别呢? 1.const是一个语言结构:而define是一个函数 ...
bzoj1012: [JSOI2008]最大数maxnumber [单调队列]
Description 现在请求你维护一个数列,要求提供以下两种操作:1. 查询操作.语法:Q L 功能:查询当前数列中末尾L个数中的最大的数,并输出这个数的值.限制:L不超过当前数列的长度.2. 插 ...
Mac系统下STF的环境搭建和运行
本文参考以下文章整理:MAC 下 STF 的环境搭建和运行一. 前言 STF,全称是Smartphone Test Farm,WEB 端批量移动设备管理控制工具,就是可以用浏览器来批量控制你的移动设 ...
用Node.JS+MongoDB搭建个人博客（app.js接口文件）（二）
app.js的GitHub地址:用力戳我然后点个star 说个题外话,THINKPHP是通过一个index.php来引入文件,所以被称为接口文件. 而NodeJS也有这样的接口文件,通常也会放在根目录 ...
ASP.NET MVC5 使用MiniProfiler 监控MVC性能
MiniProfiler ,一个简单而有效的迷你剖析器,可以有效的实时监控页面.通过直接引用.Ajax.Iframe形式访问的其它页面进行监控,监控内容包括数据库内容,并可以显示数据库访问的SQL. ...
Linux服务器中安装Oracle
笔者手动安装成功一,oracle安装前的准备与配置 1,修改stsctl.conf文件 Linux是为小文件设计的,Oracle数据库安装需要占用较多资源,要把各项参数调大. 使用vi编辑/etc/ ...
nginx实现wap移动端和PC端业务分离
随着移动互联网时代的来临,很多WEB网站都已经推出了基于手机,Ipad等移动客户端的页面访问,这里介绍一下如何利用用户UA实现用户不同终端下的用户访问: $http_user_agent 为ngin ...
Javascript DOM 编程艺术———总结-2
第三章: 一,DOM: Document(文档) Object(对象):用户定义对象,内建对象,宿主对象. Model(模型) 二,节点: 元素节点:诸如:<body> <p> ...

神经网络与深度学习笔记 Chapter 3.

交叉熵

Overfitting and regularization

神经网络与深度学习笔记 Chapter 3.的更多相关文章

随机推荐

热门专题

　　交叉熵