Cs231n课堂内容记录-Lecture 3 最优化
Lecture 4 最优化
课程内容记录:
(上)https://zhuanlan.zhihu.com/p/21360434?refer=intelligentunit
(下)https://zhuanlan.zhihu.com/p/21387326?refer=intelligentunit
1.代码注释:
numpy.random.randn():
numpy.random.randn(d0,d1,…,dn):rand函数返回一个或一组样本,具有标准正态分布。。dn对应每个维度,函数返回值为指定维度的array。
具体用法参见:https://blog.csdn.net/u012149181/article/details/78913167
float("inf"): 正无穷。
2.关于梯度:
数值梯度是利用有限差分法代入一个具体的较小值,利用公式求得对应的梯度,这个梯度值是近似的,近似程度取决于你的较小值的大小。它的优点是代码容易实现。解析梯度是利用微分直接求解梯度,优点是精确求解,解析速度快,但是有时候会出错。在debug的时候,为了检验公式的正确性,数值梯度往往是一个很好的工具,由于计算速度很慢,你可能需要适当减少参数的数量,这是一个非常好的调试策略。
注:学习率是一个很重要的超参数,在训练网络时往往是第一个需要检查的超参数,关于模型大小和正则化强度的检查往往在其之后进行。
注:交互网页项目网址(很好用,就不加以说明了):
http://vision.stanford.edu/teaching/cs231n-demos/linear-classify/
3.深度神经网络之前:
将像素直接输入线性分类器不是一个明智的选择,因为这样的模型无法分辨多模态等图片的特征,且总由背景等像素占比多的区域决定分类结果。在深度神经网络大规模运用之前,常用的方式是计算图片各种特征代表(feature representation),例如一些与图片形象特征有关的数值构成特征向量,然后将不同的特征向量合在一起,得到图像的特征表述,再将这些特征表述传入线性分类器。这种模型可以得到图片的转换特征(比如得到颜色频数直方图,或者边缘方向直方图),将某些原本线性不可分的图片特征变为线性可分的,从而可以有线性分类器进行分类。如今的深度学习网络主要的区别就是网络可以利用卷积层等结构自行学习特征,不再需要人工提取输入特征。
Cs231n课堂内容记录-Lecture 3 最优化的更多相关文章
- Cs231n课堂内容记录-Lecture 4-Part2 神经网络
Lecture 7 神经网络二 课程内容记录:https://zhuanlan.zhihu.com/p/21560667?refer=intelligentunit 1.协方差矩阵: 协方差(Cova ...
- Cs231n课堂内容记录-Lecture 4-Part1 反向传播及神经网络
反向传播 课程内容记录:https://zhuanlan.zhihu.com/p/21407711?refer=intelligentunit 雅克比矩阵(Jacobian matrix) 参见ht ...
- Cs231n课堂内容记录-Lecture 6 神经网络训练
Lecture 6 Training Neural Networks 课堂笔记参见:https://zhuanlan.zhihu.com/p/22038289?refer=intelligentun ...
- Cs231n课堂内容记录-Lecture 8 深度学习框架
Lecture 8 Deep Learning Software 课堂笔记参见:https://blog.csdn.net/u012554092/article/details/78159316 今 ...
- Cs231n课堂内容记录-Lecture 7 神经网络训练2
Lecture 7 Training Neural Networks 2 课堂笔记参见:https://zhuanlan.zhihu.com/p/21560667?refer=intelligent ...
- Cs231n课堂内容记录-Lecture 5 卷积神经网络介绍
Lecture 5 CNN 课堂笔记参见:https://zhuanlan.zhihu.com/p/22038289?refer=intelligentunit 不错的总结笔记:https://blo ...
- Cs231n课堂内容记录-Lecture 9 深度学习模型
Lecture 9 CNN Architectures 参见:https://blog.csdn.net/qq_29176963/article/details/82882080#GoogleNet_ ...
- Cs231n课堂内容记录-Lecture2-Part2 线性分类
Lecture 3 课程内容记录:(上)https://zhuanlan.zhihu.com/p/20918580?refer=intelligentunit (中)https://zhuanlan. ...
- Cs231n课堂内容记录-Lecture2-Part1 图像分类
Lecture 2 课程内容记录:(上)https://zhuanlan.zhihu.com/p/20894041?refer=intelligentunit (下)https://zhuanlan. ...
随机推荐
- kubernetes 安装kong、kong-ingress-controlor
一.关于kong的详细内容这里不再赘述,可以查看官网. kong升级到1.0以后功能越来越完善,并切新版本的kong可以作为service-mesh使用,并可以将其作为kubernetes的ingre ...
- 第一册:lesson sixty three。
原文: Thank you docter. A:How's Jim today? B:Better, thank you docter. A:Can I see him ,please? B:Cert ...
- c#使用js上传图片
前几天朋友说用js上传图片过去遇到点问题,于是自己也想写一个demo这里就把自己挖的坑填了. 话不多说上代码 前台就一个file控件加按钮 <!DOCTYPE html> <html ...
- 从零开始学安全(四)●Vmware CentOS 7 添加静态ip联网
一.虚拟网络编辑器配置 1.VMnet8设置(不需要改动) 2.NAT设置(不需要改动) 3.DHCP设置(CentOS IP地址段设置,不需要改动) 二.虚拟机设置(网络适配器选择NAT模式) 三. ...
- js中const,var,let区别(转载)
js中const,var,let区别 来源:https://www.cnblogs.com/zzsdream/p/6372729.html 今天第一次遇到const定义的变量,查阅了相关资料整理了这篇 ...
- mybatis_05动态SQL_if和where
If标签:作为判断入参来使用的,如果符合条件,则把if标签体内的SQL拼接上. 注意:用if进行判断是否为空时,不仅要判断null,也要判断空字符串‘’: Where标签:会去掉条件中的第一个and符 ...
- 【转】AtomicReference与volatile的区别
来源:AtomicReference与volatile的区别 AtomicReference与volatile的在可见性上的意义是一致的. volatile不能保证原子性,AutomicReferen ...
- Android LiveData使用
LiveData是一个可观察的数据持有者类. 与常规observable不同,LiveData是生命周期感知的,当生命周期处于STARTED或RESUMED状态,则LiveData会将其视为活动状态, ...
- angular ng-file-upload
传送门:https://github.com/danialfarid/ng-file-upload#install <script src="angular(.min).js" ...
- Django的模板系统
一.语法 关于模板渲染只需要记住两种特殊符号(语法): {{ }} 和 {% %} (变量相关用{{ }} 逻辑相关用{% %}) 二.变量 在Django的模板语言中按照{{ 变量名 }}来使用 ...