Andrew Ng-ML-第九&十章-神经网络

lypbendlf 2024-09-15 00:20:19 原文

1.神经网络模型1

图1

这是一个神经网络的模型，通常设置一个x0,作为偏执单元或者偏置(bias)神经元。

图2

这里最后一句话，说的是系数矩阵θ，神经网络模型中，如果当前在j层有s_j个单元，在j+1层有s_j+1个单元，那么第j层的系数矩阵theta_j，是s_j+1(s_j +1)维的。

//就像图中，三个公式，应该是每层其实都有一个偏置单元。s_j+1是因为输入层得到的结果要是隐含层的输入，隐含层有s_j+1个单元，(s_j +1)是+上本层的偏置单元。

2.神经网络中的分类问题

图3

对于二分类的问题，输出层只有一个输出单元，对于多分类问题(k≥3)，那么输出层就有k个输出单元。

3.神经网络的代价函数

图4

首先第一项是对输出层的输出求和，每个都乘上yk；正则项，theta右上角的（l）表示的是层数，j表示的是第j行吧，也就是一共s_j+1行，i表示的是s_j列，那么一共是L-1层的相加。每一层都加上了一个偏置，但是在图中并没有画出。通常正则化项都不把偏置项加入到其中，但是加入了之后影响也不大。

4.反向传播算法

图5

首先就是需要计算每个单元的误差，怎么计算呢？如图，输出层也就是第4层，就等于当前的计算结果-实际结果；第三层的误差，第三层权重矩阵转置*第四层误差向量*激活函数的导数。

图中还给了一个公式就是——求偏导项的公式——代价函数的对每层权重矩阵单个，求导的公式=l层第j个节点的值*l+1层第i个节点的误差。（证明过程十分复杂）

图7

z这里代表的是：每层的计算结果，代入激活函数之后就可以作为下一层神经元的输入。是三维的。

以下为伪代码：

图8

将所有误差（三角形的

Andrew Ng-ML-第九&十章-神经网络的更多相关文章

Andrew Ng机器学习课程笔记（四）之神经网络
Andrew Ng机器学习课程笔记(四)之神经网络版权声明:本文为博主原创文章,转载请指明转载地址 http://www.cnblogs.com/fydeblog/p/7365730.html 前言 ...
【原】Coursera—Andrew Ng机器学习—编程作业 Programming Exercise 4—反向传播神经网络
课程笔记 Coursera—Andrew Ng机器学习—课程笔记 Lecture 9_Neural Networks learning 作业说明 Exercise 4,Week 5,实现反向传播 ba ...
（原创）Stanford Machine Learning (by Andrew NG) --- (week 10) Large Scale Machine Learning & Application Example
本栏目来源于Andrew NG老师讲解的Machine Learning课程,主要介绍大规模机器学习以及其应用.包括随机梯度下降法.维批量梯度下降法.梯度下降法的收敛.在线学习.map reduce以 ...
（原创）Stanford Machine Learning (by Andrew NG) --- (week 7) Support Vector Machines
本栏目内容来源于Andrew NG老师讲解的SVM部分,包括SVM的优化目标.最大判定边界.核函数.SVM使用方法.多分类问题等,Machine learning课程地址为:https://www.c ...
（原创）Stanford Machine Learning (by Andrew NG) --- (week 4) Neural Networks Representation
Andrew NG的Machine learning课程地址为:https://www.coursera.org/course/ml 神经网络一直被认为是比较难懂的问题,NG将神经网络部分的课程分为了 ...
（原创）Stanford Machine Learning (by Andrew NG) --- (week 5) Neural Networks Learning
本栏目内容来自Andrew NG老师的公开课:https://class.coursera.org/ml/class/index 一般而言, 人工神经网络与经典计算方法相比并非优越, 只有当常规方法解 ...
matlab基础教程——根据Andrew Ng的machine learning整理
matlab基础教程--根据Andrew Ng的machine learning整理基本运算算数运算逻辑运算格式化输出小数位全局修改向量和矩阵运算矩阵操作申明一个矩阵或向量快速建立一 ...
斯坦福大学Andrew Ng教授主讲的《机器学习》公开课观后感［转］
近日,在网易公开课视频网站上看完了<机器学习>课程视频,现做个学后感,也叫观后感吧. 学习时间从2013年7月26日星期五开始,在网易公开课视频网站上,观看由斯坦福大学Andrew Ng ...
机器学习笔记(一)- from Andrew Ng的教学视频
最近算是一段空闲期,不想荒废,记得之前有收藏一个机器学习的链接Andrew Ng的网易公开课,其中的overfiting部分做组会报告时涉及到了,这几天有时间决定把这部课程学完,好歹算是有个粗浅的认识 ...
2014-7 Andrew Ng 自动化所报告听后感
原文:http://blog.sina.com.cn/s/blog_593af2a70102uwhl.html 一早出发,8点20就赶到现场, 人越聚越多,Ng提前几分钟到达现场,掌声一片. N ...

随机推荐

【面试题】Python高级开发工程师面试题
线上面试题,有空整理答案,欢迎大家回复答案
【PHP】 php 解析 base64图片上传
base64 图片编码格式: 类似如下 data:image/JPG;base64,/9j/4S/+RXhpZgAATU0AKgAAAAgACwEPAAIAAAAG php 解析代码如下: 基于tp ...
怎么修改mysql主键（id)的值为自增
alter table tb_name modify id int auto_increment primary key
【大数据系列】hive修改默认的derby数据库
<?xml version="1.0" encoding="UTF-8" standalone="no"?> <?xml- ...
JavaScript 正则表达式通俗解释快速记忆
1.正则表达式中最重要的三个符号: 1.1 B 在正则表达式中B有3种类型的括号: 1.1.1 方括号 “[“. 方括号"["内是需要匹配的字符.中括号括住的内容只匹配一个单一的字 ...
【黑金原创教程】【FPGA那些事儿-驱动篇I 】实验十七：IIC储存模块 - FIFO读写
. int main() . { . int A: . A = : . } 代码17.1 话题为进入之前,首先让我们来聊聊一些题外话.那些学过软核NIOS的朋友可曾记得,软核NIOS可利用片上内存作为 ...
TFS Build做Web应用持续集成发布的一个技巧
由于面向接口编程的关系,许多实现往往是动态注入运行,在一个项目中直接引用实现dll编译是不合理的.通常我们会在Post Build Event中添加一些xcopy命令将运行时才需要的dll复制到输出目 ...
Docker Compose 版本过高（Docker版本不匹配），降低docker-compose版本
通过docker-compose启动容器,报错: ERROR: The Docker Engine version is less than the minimum required by Compo ...
关于C#泛型作用的简单说明
泛型:即通过参数化类型来实现在同一份代码上操作多种数据类型.泛型编程是一种编程范式,它利用“参数化类型”将类型抽象化,从而实现更为灵活的复用. C#泛型的作用概述 C#泛型赋予了代码更强的类型安全,更 ...
tomcat启动报错：serializer.jar (系统找不到指定的文件。)
下载最新对应版本的tomcat.移除之前的tomcat.删除原本全部tomcat的目录. 疑似tomcat的lib包被动过.