概述

数据增强

思路：在训练的时候引入干扰，在测试的时候避免干扰。

翻转图片增强数据。

随机裁切图片后调整大小用于训练，测试时先图像金字塔制作不同尺寸，然后对每个尺寸在固定位置裁切固定大小进入训练，最后对所有结果取平均值。

对颜色信息进行主成分分析并重建

迁移学习

三种网络训练思路：

中量数据的训练思路：先训练附加层，收敛后整体整体微调(funetuning)

值得注意：少量低相似度数据处理方式，虽然不乐观，但可以尝试不同层提取特征后组合处理（感觉和之前看的腾讯的检测文档边缘工程案例相似：基于 TensorFlow 在手机端实现文档检测）

实际上预训练模型不是特例，几乎大型计算机视觉任务都会使用预先训练好的模型加速。

卷积网络架构

感受野大小探讨

双层3*3卷积核感受野大小为5*5

三层3*3卷积核感受野大小为7*7，有意思的是这等价于单层7*7大小的卷积核

对比同感受野不同卷积结构优劣

需学习参数多层小卷积核网络更少

运算量也是多层小卷积核结构更少

[思路]：尝试把大的单层卷积分解为小的多层卷积

[问题]：3*3是最小的了，如何分解它提升效率？

分解思路一：1*1瓶颈层

尝试1*1卷积核引入提升效率，不过由于1*1的卷积核无法顾及周边信息，所以只能作为一个辅助，上图的瓶颈结构从输入输出上来看等价于单层3*3网络

对比需学习参数，我们发现还是复杂但小的结构更少

分解思路二：不对称卷积网络

另一种分解3*3卷积网络的方法，效果同样不错

这个看起来很蹩脚的网络架构（不对称卷积网络）主要由Google使用，它自家的Inception有复杂的不对称网络&特征拼接结构（如上图），有意思的是我学习tensorflow时尝试写过Inception3的最终层结构，的确是个脑洞大开的东西，看了这节课才算明白了人家为什么这么设计。注意，上图同时也使用了1*1瓶颈层。

总结：

『cs231n』卷积神经网络工程实践技巧_上的更多相关文章

『cs231n』卷积神经网络工程实践技巧_下
概述计算加速方法一: 由于计算机计算矩阵乘法速度非常快,所以这是一个虽然提高内存消耗但是计算速度显著上升的方法,把feature map中的感受野(包含重叠的部分,所以会加大内存消耗)和卷积核全部 ...
『cs231n』卷积神经网络的可视化与进一步理解
cs231n的第18课理解起来很吃力,听后又查了一些资料才算是勉强弄懂,所以这里贴一篇博文(根据自己理解有所修改)和原论文的翻译加深加深理解,其中原论文翻译比博文更容易理解,但是太长,而博文是业者而非 ...
Stanford CS231n实践笔记（课时22卷积神经网络工程实践技巧与注意点 cnn in practise 上）
本课主要2个实践内容: 1.keras中数据集丰富,从数据集中提取更多特征(Data augmentation) 2.迁移学习(Tranform learning) 代码:https://github ...
『cs231n』循环神经网络RNN
循环神经网络循环神经网络介绍摘抄自莫凡博士的教程序列数据我们想象现在有一组序列数据 data 0,1,2,3. 在当预测 result0 的时候,我们基于的是 data0, 同样在预测其他数据的 ...
『cs231n』通过代码理解风格迁移
『cs231n』卷积神经网络的可视化应用文件目录 vgg16.py import os import numpy as np import tensorflow as tf from downloa ...
『cs231n』计算机视觉基础
线性分类器损失函数明细: 『cs231n』线性分类器损失函数最优化Optimiz部分代码: 1.随机搜索 bestloss = float('inf') # 无穷大 for num in range ...
『TensorFlow』通过代码理解gan网络_中
『cs231n』通过代码理解gan网络&tensorflow共享变量机制_上上篇是一个尝试生成minist手写体数据的简单GAN网络,之前有介绍过,图片维度是28*28*1,生成器的上采样使 ...
【cs231n】卷积神经网络
较好的讲解博客: 卷积神经网络基础深度卷积模型目标检测人脸识别与神经风格迁移译者注:本文翻译自斯坦福CS231n课程笔记ConvNet notes,由课程教师Andrej Karpathy授权 ...
『cs231n』通过代码理解gan网络&tensorflow共享变量机制_上
GAN网络架构分析上图即为GAN的逻辑架构,其中的noise vector就是特征向量z,real images就是输入变量x,标签的标准比较简单(二分类么),real的就是tf.ones,fake ...

随机推荐

彻底明白Flink系统学习5：window、Linux本地安装Flink
http://www.aboutyun.com/thread-26393-1-1.html 问题导读 1.如何在window下安装Flink? 2.Flink本地安装启动命令与原先版本有什么区别? 3 ...
用Python实现随机森林算法，深度学习
用Python实现随机森林算法,深度学习拥有高方差使得决策树(secision tress)在处理特定训练数据集时其结果显得相对脆弱.bagging(bootstrap aggregating 的缩 ...
zendstudio中加入对tpl文件的支持，用HTML Editor编辑器编辑
zendstudio中加入对tpl文件的支持,用HTML Editor编辑器编辑:ThinkPHP中默认使用的tpl在zendstudio中默认打开都是文本编辑器的,没有语法提示开发效率很低,直接设置 ...
SpringBoot之统一异常处理
异常,不仅仅是程序运行状态的描述,还可以使得代码编写更加的规范 1.自定义异常:FieldValueInvalidException package com.geniuses.sewage_zer ...
浅谈CORS
浅谈CORS CORS全称"跨站资源共享"(Cross-Origin Resource Sharing),它允许浏览器克服浏览器同源策略向跨域服务器发出请求. 同源策略概念说到 ...
ACM题目————Face The Right Way
Description Farmer John has arranged his N (1 ≤ N ≤ 5,000) cows in a row and many of them are facing ...
python no module named 'win32api'
在cmd下执行 pip install pypiwin32api 即可
P4281 [AHOI2008]紧急集合 / 聚会
P4281 [AHOI2008]紧急集合 / 聚会 lca 题意:求3个点的lca,以及3个点与lca的距离之和. 性质:设点q1,q2,q3 两点之间的lca t1=lca(q1,q2) t2=lc ...
使用qmlscene预览qml文件
功能:可以预览qml文件的界面使用:qmlscene myapp.qml
Python3基础 os listdir curdir pardir 查看工作目录及其上一级目录的所有文件名
Python : 3.7.0 OS : Ubuntu 18.04.1 LTS IDE : PyCharm 2018.2.4 Conda ...

『cs231n』卷积神经网络工程实践技巧_上

概述