Neural networks

non-linear hypotheses 非线性假设

Neural model：logistic unit

第一层 Input layer

最后一层 Outer layer

其他层 Hidden layer

对于非线性模型问题，神经网络就是logistic回归的复杂模型。

前向传播

比较logistic和neural network

之前的logistic回归：有x个特征，真正需要的特征可能是y个(y>>x)
比如：预测房价，特征有房子长度和宽度(x=2)，而真正需要的特征可能是长度、宽度、面积(长度*宽度)。y=3

logistic回归的重点是找到更多可能有用的多项式特征，来循环一个sigma函数。它更注重长度

Neural networks：只将x个特征作为输入层，不在乎多项式特征。

神经网络是n*m个sigma函数的组合，用少量的特征进行层层运算得到更复杂的特征。它更注重深度、宽度。

neural network分类

二元分类和多分类问题

neural network的cost function

这个看起来复杂很多的代价函数背后的思想还是一样的，我们希望通过代价函数来观察算法预测的结果与真实情况的误差有多大。

反向传播

back propagation: 求导数值

前向传播是特征值的“加权和+sigma函数”从左到右传播

反向传播是“偏导数加权和”从右向左传播

梯度检验

gradient checking：检验反向传播时求的导数值是否正确。但是因为计算一次导数梯度检验运行时间比反向传播长很多，所以一旦确定了反向传播没有计算错时，记得禁掉梯度检验的代码。

随机初始化

random initialization：初始化神经网络里的初始参数(权重)

neural network全过程回顾

Pick network architecture
Input layer：单元数目由特征个数决定
Output layer：单元数目由分多少类决定
Hidden layer：层数一般1层(也可以2、3层)，单元数目一般和Input layer数目相等或是x倍(x=1、2、3)

2.1 初始化权重(接近于0)

2.2 前向传播求预测值

2.3 计算cost function

2.4 反向传播求偏导数

2.5 梯度检验验证反向传播求的偏导数

2.6 用梯度下降或其他高级优化方法minimize代价函数

Coursera-吴恩达机器学习课程笔记-Week4+5的更多相关文章

ML:吴恩达机器学习课程笔记(Week1~2)
吴恩达(Andrew Ng)机器学习课程:课程主页由于博客编辑器有些不顺手,所有的课程笔记将全部以手写照片形式上传.有机会将在之后上传课程中各个ML算法实现的Octave版本. Linear Reg ...
Coursera 吴恩达机器学习学习笔记
Week 1 机器学习笔记(一)基本概念与单变量线性回归 Week 2 机器学习笔记(二)多元线性回归机器学习作业(一)线性回归——Matlab实现机器学习作业(一)线性回归——Python( ...
ML:吴恩达机器学习课程笔记(Week7~8)
Support Vector Machines Unsupervised Learning Dimensionality Reduction
ML:吴恩达机器学习课程笔记(Week5~6)
Neural Networks: Learning Advice for Applying Machine Learning Machine Learning System Design
ML:吴恩达机器学习课程笔记(Week9~10)
Anomaly Detection Recommender Systems Large Scale Machine Learning
ML:吴恩达机器学习课程笔记(Week3~4)
Logistic Regression Regularization Neural Networks: Representation
Coursera-吴恩达机器学习课程笔记-Week2
参考资料: 吴恩达教授机器学习课程机器学习课程中文笔记 Week2 一. 多变量线性回归(Linear Regression with Multiple Variables) 多变量就时当一个exa ...
Coursera-吴恩达机器学习课程笔记-Week1
参考资料: 吴恩达教授机器学习课程机器学习课程中文笔记 Week 1 一. 引言机器学习模型可分为监督学习Superviese learning(每个数据集给出了正确的值)和无监督学习Unsupe ...
Machine Learning|Andrew Ng|Coursera 吴恩达机器学习笔记
Week1: Machine Learning: A computer program is said to learn from experience E with respect to some ...

随机推荐

[IOI2002] 任务安排
题目链接题意一些不能改变顺序的任务被分成若干批,每批包含相邻的若干任务.第 $i$ 个任务单独完成所需的时间是 $T_i$.在每批任务开始前,机器需要启动时间 $S$,而完成这批任务所需的时间是各 ...
Python基础与科学计算常用方法
Python基础与科学计算常用方法本文使用的是Jupyter Notebook,Python3.你可以将代码直接复制到Jupyter Notebook中运行,以便更好的学习. 导入所需要的头文件 i ...
麦子html基础
一.基础语法 1.基本结构
log设计网站，一站式一键设计log网站
log设计网站,一站式一键设计log网站 log设计网站,一键式一站式设计log网站待办 https://www.wix.com/buildyourwebsite5/designlogo?utm_s ...
Strategic game树形DP解法(Poj1463,Uva1292)
已经写过本题用二分图的做法,见这儿. 本题的图是一棵树,求最小点覆盖也可以用树形DP的做法. 定义状态f[0/1][u]表示以u为根的子树,u选取/不选最少需要选取多少点来覆盖. 显然 f[0][u] ...
EAC3 mantissa quantization(VQ & GAQ)
EAC3基于hebap来决定mantissa的quantizer. hebap如下: mantissa 使用VQ(vector quantization) 和GAQ(gain adaptive qua ...
【做题笔记】洛谷P1002过河卒
虽说是 dp 入门题,但还是有很多细节需要注意如果设 $f_{x,y}$ 为目标地点为 $(x,y)$ 时走的种数,那么答案就是 $f_{n,m}$ 在不考虑那只讨厌的马的情况下,对于任 ...
python开发基础01-字符串操作方法汇总
字符串 Python对字符串的处理内置了很多高效的函数,非常方便功能很强大. "hello world" 字符串七种常用功能: 连接和合并 + join 移除空白 strip 分 ...
bugku flag在index里
原题内容: http://120.24.86.145:8005/post/ Mark一下这道题,前前后后弄了两个多小时,翻了一下别的博主的wp感觉还是讲的太粗了,这里总结下自己的理解: 首先打开这道题 ...
spring controller中默认转发、forward转发、redirect转发之间的区别
默认转发 @RequestMapping("/123") public String test(HttpSession session) { System.out.println( ...

Coursera-吴恩达机器学习课程笔记-Week4+5