概述

计算加速

方法一：

由于计算机计算矩阵乘法速度非常快，所以这是一个虽然提高内存消耗但是计算速度显著上升的方法，把feature map中的感受野（包含重叠的部分，所以会加大内存消耗）和卷积核全部拉伸成为向量，组成两个矩阵相乘，再想办法恢复为输出的feature map。

方法二：

利用傅里叶变换的特性加速计算，思路来源于信号处理，只对大卷积核有效。

方法三：

思路来源于经典算法，用的人很少，老师也没怎么介绍，个人亦是不太感兴趣，需要的时候自己查资料吧。

总结：

比较简要的总结就是，如果真的需要自己实现卷积层的时候，那就使用im2col提高效率吧。

GPU/CPU

这一部分老师天南海北的扯了不少，中心思想就是：深度学习使用GPU分布式计算效果更好，英伟达伟光正（历史局限性问题，现在的谷歌的TPU貌似也有崛起的可能）。

不过下图还是展示了，即使GPU在并行计算领域效能非凡（相对应的CPU很擅长顺序处理），面对深度学习的海量数据计算还是力不从心，而且，好的GPU价格往往不菲（不是我吐槽，这是老师说的），

性能瓶颈

虽然GPU计算速度极其高效，但GPU和CPU数据相互拷贝过程还是会消耗大量时间

文件读取，比如打开批量jpg时，由于不同图片存放于硬盘不同位置，随机索引会消耗大量时间，而解压缩也会消耗大量时间，所以一般的做法是进行预处理，解压为顺序存储的像素文件，一般各个框架都有自己的标准文件格式

网瘾少年都知道，GPU么，内存越大（价格越贵）越好，(逃...

浮点类型

深度学习常使用单精度（32位）浮点数，

1.节省内存，可以存储更多的数据

2.更少的位数，更少的计算量，更快的运算速度

在课程中的程序中，由于numpy默认精度是64位，一般都给出了显示的类型转换。

实际上有很多16位的尝试，也有一些取得了不错的结果，但是16位的表示范围和精度是个问题，有人做过尝试：正常的16位运算由于误差积累较难收敛，如果运算结果使用高精度暂存，然后随机四舍五入（具体怎么随机不太明晰）的话，结果不错，还有人使用10位激活函数+12位参数更新的精度组合进行计算，结果也不错，还有极端人士使用1位（1或-1）进行计算，老师说很酷，我觉得这只是他的中性的口头禅吧... ...

总之，现在老老实实的使用32位即可，以后说不定会使用16位计算。

总结

『cs231n』卷积神经网络工程实践技巧_下的更多相关文章

『cs231n』卷积神经网络工程实践技巧_上
概述数据增强思路:在训练的时候引入干扰,在测试的时候避免干扰. 翻转图片增强数据. 随机裁切图片后调整大小用于训练,测试时先图像金字塔制作不同尺寸,然后对每个尺寸在固定位置裁切固定大小进入训练,最 ...
『cs231n』卷积神经网络的可视化与进一步理解
cs231n的第18课理解起来很吃力,听后又查了一些资料才算是勉强弄懂,所以这里贴一篇博文(根据自己理解有所修改)和原论文的翻译加深加深理解,其中原论文翻译比博文更容易理解,但是太长,而博文是业者而非 ...
Stanford CS231n实践笔记（课时22卷积神经网络工程实践技巧与注意点 cnn in practise 上）
本课主要2个实践内容: 1.keras中数据集丰富,从数据集中提取更多特征(Data augmentation) 2.迁移学习(Tranform learning) 代码:https://github ...
『cs231n』循环神经网络RNN
循环神经网络循环神经网络介绍摘抄自莫凡博士的教程序列数据我们想象现在有一组序列数据 data 0,1,2,3. 在当预测 result0 的时候,我们基于的是 data0, 同样在预测其他数据的 ...
『cs231n』通过代码理解风格迁移
『cs231n』卷积神经网络的可视化应用文件目录 vgg16.py import os import numpy as np import tensorflow as tf from downloa ...
『cs231n』计算机视觉基础
线性分类器损失函数明细: 『cs231n』线性分类器损失函数最优化Optimiz部分代码: 1.随机搜索 bestloss = float('inf') # 无穷大 for num in range ...
『TensorFlow』通过代码理解gan网络_中
『cs231n』通过代码理解gan网络&tensorflow共享变量机制_上上篇是一个尝试生成minist手写体数据的简单GAN网络,之前有介绍过,图片维度是28*28*1,生成器的上采样使 ...
【cs231n】卷积神经网络
较好的讲解博客: 卷积神经网络基础深度卷积模型目标检测人脸识别与神经风格迁移译者注:本文翻译自斯坦福CS231n课程笔记ConvNet notes,由课程教师Andrej Karpathy授权 ...
『cs231n』通过代码理解gan网络&tensorflow共享变量机制_上
GAN网络架构分析上图即为GAN的逻辑架构,其中的noise vector就是特征向量z,real images就是输入变量x,标签的标准比较简单(二分类么),real的就是tf.ones,fake ...

随机推荐

hihoCoder week14 无间道之并查集
并查集的基本使用 #include <bits/stdc++.h> using namespace std; ; int n, fa[N]; int cnt, tot; map<st ...
常用的 Linux 命令
列出文件列表:ls [参数 -a -l]创建目录和移除目录:mkdir rmdir用于显示文件后几行内容:tail打包:tar -xvf打包并压缩:tar -zcvf查找字符串:grep显示当前所在目 ...
利用Spring Cloud实现微服务- 熔断机制
1. 熔断机制介绍在介绍熔断机制之前,我们需要了解微服务的雪崩效应.在微服务架构中,微服务是完成一个单一的业务功能,这样做的好处是可以做到解耦,每个微服务可以独立演进.但是,一个应用可能会有多个微服 ...
Python中的垃圾回收机制
Python的垃圾回收机制引子: 我们定义变量会申请内存空间来存放变量的值,而内存的容量是有限的,当一个变量值没有用了(简称垃圾)就应该将其占用的内存给回收掉,而变量名是访问到变量值的唯一方式,所以 ...
QT使用QJson生成解析Json数据的方法
QT中使用json还是比较方便的,下面用例子直接说明举例子之前首先推荐一个在线解析json格式的网站,具体格式用法如下图所示: 之后根据这个格式进行json数据解析. QT使用json需要包含的头文 ...
WaitingFormHelper
using Lba_Ciac; using System; using System.Collections.Generic; using System.Linq; using System.Text ...
mail命令
mail命令是命令行的电子邮件发送和接收工具.操作的界面不像elm或pine那么容易使用,但功能非常完整. 语法 mail(选项)(参数) 选项 -b<地址>:指定密件副本的收信人地址: ...
Unity--game
打怪兽--头像状态 Git :https://github.com/vinieo/attck 打怪兽--背景音乐音量 Git :https://github.com/vinieo/ack_bgm 小球 ...
Eclipse中使用MySql遇到：Loading class `com.mysql.jdbc.Driver'. This is deprecated. The new driver class is `com.mysql.cj.jdbc.Driver'. The driver is automatically registered via the SPI and manual loading o
在Eclipse中使用MySQL遇到了点小问题如果对Eclipse中配置MySql还有疑问的可以参考一下这篇博客:https://blog.csdn.net/qq_38247544/article/ ...
js,java时间处理
1.JS获取时间格式为“yyyy-MM-dd HH:mm:ss”的字符串 function getTimeStr(){ var myDate = new Date(); var year = myDa ...

『cs231n』卷积神经网络工程实践技巧_下

概述