『cs231n』计算机视觉基础

线性分类器损失函数明细：

最优化Optimiz部分代码：

1.随机搜索

bestloss = float('inf')  # 无穷大

for num in range(1000):

    W = np.random.randn(10, 3073) * 0.0001

    loss = L(X_train, Y_train, W)

    if loss < bestloss:

        bestloss = loss

        bestW = W

scores = bsetW.dot(Xte_cols)

Yte_predict = np.argmax(score, axis = 0)

np.mean(Yte_predict == Yte)

核心思路：迭代优化

2.随机本地搜索

W = np.random.randn(10, 3073) * 0.001

bestloss = float('inf')

for i in range(1000):

    step_size = 0.0001

    Wtry = np.random.randn(10, 3073) * step_size

    loss = L(Xtr_cols, Ytr, Wtry)

    if loss < bestloss:

        W = Wtry

        bestloss = loss

3.利用有限差值计算梯度（数值计算梯度）

def eval_numerical_gradient(f, x):

  """

  一个f在x处的数值梯度法的简单实现

  - f是只有一个参数的函数

  - x是计算梯度的点

  """ 

  fx = f(x) # 在原点计算函数值

  grad = np.zeros(x.shape)

  h = 0.00001

  # 对x中所有的索引进行迭代

  it = np.nditer(x, flags=['multi_index'], op_flags=['readwrite'])

  while not it.finished:

    # 计算x+h处的函数值

    ix = it.multi_index

    old_value = x[ix]

    x[ix] = old_value + h # 增加h

    fxh = f(x) # 计算f(x + h)

    x[ix] = old_value # 存到前一个值中 (非常重要)

    # 计算偏导数

    grad[ix] = (fxh - fx) / h # 坡度

    it.iternext() # 到下个维度

  return grad

One_Hot编码

a 0,0,0,1

b 0,0,1,0

c 0,1,0,0

d 1,0,0,0

这样

数据优化另一个方面

下面的代码理论上输出1.0,实际输出0.95,也就是说在数值偏大的时候计算会不准

a = 10**9

for i in range(10**6):

    a = a + 1e-6

print (a - 10**9)

# 0.95367431640625

所以会有优化初始数据的过程，最好使均值为0,方差相同：

以红色通道为例：(R-128）/128

稀疏矩阵

0元素很多的矩阵是稀疏矩阵，便于优化（收敛速度快）有一种说法是提取单一特征时不需要同时激活那么多的神经元，所以抑制其他神经元效果反而更好L1正则化是一种常用稀疏化手段

L2正则化由于加了平方，所以权重影响项可以很接近零,反而不会被继续优化到0，没有稀疏的效果。（）

『cs231n』计算机视觉基础的更多相关文章

『cs231n』通过代码理解风格迁移
『cs231n』卷积神经网络的可视化应用文件目录 vgg16.py import os import numpy as np import tensorflow as tf from downloa ...
『cs231n』通过代码理解gan网络&tensorflow共享变量机制_上
GAN网络架构分析上图即为GAN的逻辑架构,其中的noise vector就是特征向量z,real images就是输入变量x,标签的标准比较简单(二分类么),real的就是tf.ones,fake ...
『cs231n』绪论
笔记链接 cs231n系列所有图片笔记均拷贝自网络,链接如上,特此声明,后篇不再重复. 计算机视觉历史总结出视觉两个重要结论:1.基础的视觉神经识别的是简单的边缘&轮廓2.视觉是分层的数据 ...
『cs231n』卷积神经网络的可视化与进一步理解
cs231n的第18课理解起来很吃力,听后又查了一些资料才算是勉强弄懂,所以这里贴一篇博文(根据自己理解有所修改)和原论文的翻译加深加深理解,其中原论文翻译比博文更容易理解,但是太长,而博文是业者而非 ...
『cs231n』视频数据处理
视频信息和我之前的臆想不同,视频数据不仅仅是一帧一帧的图片本身,还包含个帧之间的联系,也就是还有一个时序的信息维度,包含人的动作判断之类的任务都是要依赖动作的时序信息的视频数据处理的两种基本方法 ...
『cs231n』作业1选讲_通过代码理解KNN&交叉验证&SVM
通过K近邻算法探究numpy向量运算提速茴香豆的“茴”字有... ... 使用三种计算图片距离的方式实现K近邻算法: 1.最为基础的双循环 2.利用numpy的broadca机制实现单循环 3.利用 ...
『cs231n』卷积神经网络工程实践技巧_上
概述数据增强思路:在训练的时候引入干扰,在测试的时候避免干扰. 翻转图片增强数据. 随机裁切图片后调整大小用于训练,测试时先图像金字塔制作不同尺寸,然后对每个尺寸在固定位置裁切固定大小进入训练,最 ...
『cs231n』作业3问题3选讲_通过代码理解图像梯度
Saliency Maps 这部分想探究一下 CNN 内部的原理,参考论文 Deep Inside Convolutional Networks: Visualising Image Classifi ...
『cs231n』RNN之理解LSTM网络
概述 LSTM是RNN的增强版,1.RNN能完成的工作LSTM也都能胜任且有更好的效果:2.LSTM解决了RNN梯度消失或爆炸的问题,进而可以具有比RNN更为长时的记忆能力.LSTM网络比较复杂,而恰 ...

随机推荐

Linux基础命令---eject
eject eject指令允许在软件控制下弹出可移动媒体(通常是光盘.软盘.磁带或Jaz或ZIP磁盘).该命令还可以控制一些由某些设备支持的自动弹出功能的多光盘转换器,并关闭一些光盘驱动器的盘. 对应 ...
tomcat性能调优大赞
从“第三天”的性能测试一节中,我们得知了决定性能测试的几个重要指标,它们是: ü 吞吐量 ü Responsetime ü Cpuload ü MemoryUsage 我们也在第三天的学习中对Apa ...
Django框架----视图函数补充
视图函数的补充 1.视图函数:一定是要包含两个对象的(render源码里面有HttpResponse对象) request对象:----->所有的请求信息 HttpResponse:-- ...
如何写出一个让人很难发现的bug？
程序员的日常三件事:写bug.改bug.背锅.连程序员都自我调侃道,为什么每天都在加班?因为我的眼里常含bug. 那么如何写出一个让(坑)人(王)很(之)难(王)发现的bug呢? - 1 -新手开发+ ...
html/jquery最实用功能与注意点
获取某元素的父元素通常用在根据被click的td获取tbody时. parent是指取得一个包含着所有匹配元素的唯一父元素的元素集合.parents则是取得一个包含着所有匹配元素的祖先元素的元素集合 ...
codevs 1423 骑士 - Tarjan - 动态规划
题目描述 Description Z国的骑士团是一个很有势力的组织,帮会中汇聚了来自各地的精英.他们劫富济贫,惩恶扬善,受到社会各界的赞扬. 最近发生了一件可怕的事情,邪恶的Y国发动了一场针对Z国的侵 ...
BZOJ 1044: [HAOI2008]木棍分割 DP 前缀和优化
题目链接咳咳咳,第一次没大看题解做DP 以前的我应该是这样的哇咔咔,这tm咋做,不管了,先看个题解,再写代码终于看懂了,卧槽咋写啊,算了还是抄吧第一问类似于noip的那个跳房子,随便做这里重 ...
[BZOJ1044][HAOI2008]木棍分割二分 + 单调队列优化dp + 滚动数组优化dp
Description 有n根木棍, 第i根木棍的长度为Li,n根木棍依次连结了一起, 总共有n-1个连接处. 现在允许你最多砍断m个连接处, 砍完后n根木棍被分成了很多段,要求满足总长度最大的一段长 ...
Unity3D学习笔记（六）：三角函数和点乘
三角函数: 概念:用来描述三角形中某个角和对应的三条边的比例关系. 正弦:sin<θ>(sin<theta>)=对边/斜边余弦:cos<θ>(cos<the ...
caffe深度学习网络(.prototxt)在线可视化工具：Netscope Editor
http://ethereon.github.io/netscope/#/editor 网址:http://ethereon.github.io/netscope/#/editor 将.prototx ...