笔记：CS231n+assignment2（作业二）（三）

终于来到了最终的大BOSS，卷积神经网络~

这里我想还是主要关注代码的实现，具体的CNN的知识点想以后在好好写一写，CNN的代码关键就是要加上卷积层和池话层.

一、卷积层

　　卷积层的前向传播还是比较容易的，我们主要关注的是反向传播，看下图就知道了：

def conv_forward_naive(x, w, b, conv_param):

    stride, pad = conv_param['stride'], conv_param['pad']

    N, C, H, W = x.shape

    F, C, HH, WW = w.shape

    x_padded = np.pad(x, ((0, 0), (0, 0), (pad, pad), (pad, pad)), mode='constant') #补零

    H_new = 1 + (H + 2 * pad - HH) / stride

    W_new = 1 + (W + 2 * pad - WW) / stride

    s = stride

    out = np.zeros((N, F, H_new, W_new))

    for i in xrange(N):       # ith image

        for f in xrange(F):   # fth filter

            for j in xrange(H_new):

                for k in xrange(W_new):

                    out[i, f, j, k] = np.sum(x_padded[i, :, j*s:HH+j*s, k*s:WW+k*s] * w[f]) + b[f]#对应位相乘

    cache = (x, w, b, conv_param)

    return out, cache

def conv_backward_naive(dout, cache):

    x, w, b, conv_param = cache

    pad = conv_param['pad']

    stride = conv_param['stride']

    F, C, HH, WW = w.shape

    N, C, H, W = x.shape

    H_new = 1 + (H + 2 * pad - HH) / stride

    W_new = 1 + (W + 2 * pad - WW) / stride

    dx = np.zeros_like(x)

    dw = np.zeros_like(w)

    db = np.zeros_like(b)

    s = stride

    x_padded = np.pad(x, ((0, 0), (0, 0), (pad, pad), (pad, pad)), 'constant')

    dx_padded = np.pad(dx, ((0, 0), (0, 0), (pad, pad), (pad, pad)), 'constant')

    for i in xrange(N):       # ith image

        for f in xrange(F):   # fth filter

            for j in xrange(H_new):

                for k in xrange(W_new):

                    window = x_padded[i, :, j*s:HH+j*s, k*s:WW+k*s]

                    db[f] += dout[i, f, j, k]

                    dw[f] += window * dout[i, f, j, k]

                    dx_padded[i, :, j*s:HH+j*s, k*s:WW+k*s] += w[f] * dout[i, f, j, k]#上面的式子，关键就在于+号

    # Unpad

    dx = dx_padded[:, :, pad:pad+H, pad:pad+W]

    return dx, dw, db

　　和http://www.cnblogs.com/tornadomeet/p/3468450.html中提到的一样，卷积层的BP算法就是这么计算的，也就是一个正统的卷积操作

二、pooling层

def max_pool_forward_naive(x, pool_param):

    HH, WW = pool_param['pool_height'], pool_param['pool_width']

    s = pool_param['stride']

    N, C, H, W = x.shape

    H_new = 1 + (H - HH) / s

    W_new = 1 + (W - WW) / s

    out = np.zeros((N, C, H_new, W_new))

    for i in xrange(N):

        for j in xrange(C):

            for k in xrange(H_new):

                for l in xrange(W_new):

                    window = x[i, j, k*s:HH+k*s, l*s:WW+l*s]

                    out[i, j, k, l] = np.max(window)

    cache = (x, pool_param)

    return out, cache

def max_pool_backward_naive(dout, cache):

    x, pool_param = cache

    HH, WW = pool_param['pool_height'], pool_param['pool_width']

    s = pool_param['stride']

    N, C, H, W = x.shape

    H_new = 1 + (H - HH) / s

    W_new = 1 + (W - WW) / s

    dx = np.zeros_like(x)

    for i in xrange(N):

        for j in xrange(C):

            for k in xrange(H_new):

                for l in xrange(W_new):

                    window = x[i, j, k*s:HH+k*s, l*s:WW+l*s]

                    m = np.max(window)               #获得之前的那个值，这样下面只要windows==m就能得到相应的位置

                    dx[i, j, k*s:HH+k*s, l*s:WW+l*s] = (window == m) * dout[i, j, k, l]

    return dx

三、与之前的区别

　　这里BN算法与之前是不太一样的，因为网络的输入变成了saptail的

def spatial_batchnorm_forward(x, gamma, beta, bn_param):

    N, C, H, W = x.shape

    x_new = x.transpose(0, 2, 3, 1).reshape(N*H*W, C)#分成不同的channel来算，所以可以直接用之前的代码

    out, cache = batchnorm_forward(x_new, gamma, beta, bn_param)

    out = out.reshape(N, H, W, C).transpose(0, 3, 1, 2)

    return out, cache

def spatial_batchnorm_backward(dout, cache):

    N, C, H, W = dout.shape

    dout_new = dout.transpose(0, 2, 3, 1).reshape(N*H*W, C)

    dx, dgamma, dbeta = batchnorm_backward(dout_new, cache)

    dx = dx.reshape(N, H, W, C).transpose(0, 3, 1, 2)

    return dx, dgamma, dbeta

四、总结

　　assignment2终于弄完了，总的来说..numpy还是要多熟悉，具体的操作也要熟悉。卷积层的前向传播很好理解，反向传播和之前的区别不大，只不过需要做一个卷积的操作。

笔记：CS231n+assignment2（作业二）（三）的更多相关文章

【hadoop代码笔记】hadoop作业提交之汇总
一.概述在本篇博文中,试图通过代码了解hadoop job执行的整个流程.即用户提交的mapreduce的jar文件.输入提交到hadoop的集群,并在集群中运行.重点在代码的角度描述整个流程,有些 ...
C语言作业（三）
一.完成PTA上四题作业二.具体解题 (一).A乘以B 1.实验代码 #include <stdio.h> int main() { int A,B,C; scanf("%d ...
《团队作业第三、第四周》五小福团队作业--Scrum 冲刺阶段--Day7
<团队作业第三.第四周>五小福团队作业--Scrum 冲刺阶段--Day7 一.项目燃尽图二.项目进展 [20172301郭恺第七天的进展] 第七天完成的任务: 代码整合,界面调整为相对 ...
JavaScript学习笔记之数组（二）
JavaScript学习笔记之数组(二) 1.['1','2','3'].map(parseInt) 输出什么,为什么? ['1','2','3'].map(parseInt)//[1,NaN,NaN ...
day1 作业二：多级菜单操作
作业二:多级菜单 (1)三级菜单 (2)可以次选择进入各子菜单 (3)所需新知识点:列表.字典要求:输入b返回上一层,输入q退出整个程序思路:三级菜单第一级别是省,第二级别是市,第三级别是县,用户 ...
OO作业第三单元总结
目录一.JML语言理论基础及应用工具链二.部署JMLUnitNG,自动生成测试用例三.架构设计第一次作业第二次作业第三次作业四.Bug分析五.心得体会一.JML语言理论基础及应用工具 ...
ufldl学习笔记与编程作业：Logistic Regression（逻辑回归）
ufldl学习笔记与编程作业:Logistic Regression(逻辑回归) ufldl出了新教程,感觉比之前的好,从基础讲起.系统清晰,又有编程实践. 在deep learning高质量群里面听 ...
《团队作业第三、四周》五阿哥小组Scrum 冲刺阶段---Day3
<团队作业第三.四周>五阿哥小组Scrum 冲刺阶段---Day3 一.项目燃尽图二.项目进展 20182310周烔今日进展: 主要任务一览:界面布局的设计 20182330魏冰妍今日进 ...
《团队作业第三、四周》五阿哥小组Scrum 冲刺阶段---Day4
<团队作业第三.四周>五阿哥小组Scrum 冲刺阶段---Day3 一.项目燃尽图二.项目进展 20182310周烔今日进展: 主要任务一览:聊天软件主界面 20182330魏冰妍今日进 ...
《团队作业第三、四周》五阿哥小组Scrum 冲刺阶段---Day2
<团队作业第三.四周>五阿哥小组Scrum 冲刺阶段---Day2 一.项目燃尽图二.项目进展 20182310周烔今日进展: 主要任务一览:完成总博客的提交,制定接下来的计划,编写博客 ...

随机推荐

记页面使用overflow-scroll在iOS上滑动卡顿的问题
页面使用overflow-scroll在iOS上滑动卡顿的问题因在做一个滑动的list列表,为某个div使用了overflow: scroll属性. 结果在手机上测试时,ios手机有明显的滑动卡顿问 ...
arm-none-linux-gnueabi-gcc No such file or directory这个错误的解决方法
这个gcc可执行文件是32位的版本,而在64位系统上需要安装32位兼容包才可以运行正常 .用file命令查看这个文件得到: 解决办法: 安装ia32-libs sudo apt-get install ...
Urllib库：python内置的http请求库
1.四个模块: request error parse robotparser 2.urlopen(url, data, timeout) 发送请求 get请求无data: post请求有data 3 ...
vbox+Vagrant 入门指南
Vagrant 简介 Vagrant 是一个用来构建和管理虚拟机环境的工具.Vagrant 有着易于使用的工作流,并且专注于自动化,降低了开发者搭建环境的时间,提高了生产力.解决了"在我的机 ...
python爬虫-简单使用xpath下载图片
首先 1.为方便以下进行谷歌浏览器里要安装xpath脚本 2.下载一个lmxl 命令:pip install lxml 3. 以下三张图是一个,当时爬的 <糗事百科>里的图片值 ...
笔记-cookie参数
笔记-cookie参数 cookie各个参数详解定义和用法 setcookie()函数向客户端发送一个 HTTP cookie. cookie是由服务器发送到浏览器的变量.cookie 通常是服务器 ...
format内置函数
1. 函数功能将一个数值进行格式化显示. 2. 如果参数format_spec未提供,则和调用str(value)效果相同,转换成字符串格式化. >>> format(3.14159 ...
RSA 加解密算法详解
RSA 为"非对称加密算法".也就是加密和解密用的密钥不同. (1)乙方生成两把密钥(公钥和私钥).公钥是公开的,任何人都可以获得,私钥则是保密的. (2)甲方获取乙方的公钥,然后 ...
printf("%d \n", -1 < sizeof(int) ) Implicit conversion
; printf( < sizeof(int) ); 结果输出: 0 在写程序时,经常对于比较很随意,特别是类型不同时,然而这带来的错误也是意想不到,却理所当然. 剖析: sizeof(int) ...
2016年后web开发趋势是什么?
2016 年后 Web开发趋势是什么来源:yafeilee.me 发布时间:2016-05-06 阅读次数:1378 3 近二年的进展前端发展日新月异, 甚至有一句戏言: "每六星期 ...

笔记：CS231n+assignment2（作业二）（三）

笔记：CS231n+assignment2（作业二）（三）的更多相关文章

随机推荐

热门专题