自己定义CNN网络模型并使用caffe训练

caffe自带的例子中对mnist手写体数字训练使用的卷积神经网络是在lenet_train_test.prototxt中定义的，隐含层包含了2个卷积层，2个池化层，2个全连接层，1个激活函数层。网络结构如下：

这里尝试修改一下lenet_train_test.prototxt文件，减少或增加一组卷积层和池化层，对比一下各自的训练精度和损失。

1. 减少一组卷积层和池化层

这样隐含层就包含了1个卷积层，1个池化层，2个全连接层，1个激活函数层。修改的方式直接在lenet_train_test.prototxt文件中删除第二卷积层和第二池化层的定义，并把第一全连接层的输入改成第一池化层的输出就行了（同时把第一卷积层的输出由20改成了50）。

修改之后的网络结构：

训练结果：

1. 增加一组卷积层和池化层

这样隐含层就包含了3个卷积层，3个池化层，2个全连接层，1个激活函数层。这里要注意的是图像大小是28*28，第一和第二卷积层的卷积核大小都是5*5，第一和第二池化层的池化核大小都是2*2，所以经过第二池化层之后单个图片的大小就只有
(（28-4）/2-4)/2=4，即4*4大小了，那新加的第三卷积层的卷积核就不能再是5*5了，这里改用3*3的卷积核，之后的第三池化核大小改成1*1，步长也改成1，修改之后的网络结果：

训练结果：

不做修改，正常情况下lenet_train_test.prototxt的训练结果为：

对比

减少一组卷积层和池化层的训练精度： 0.9881

减少一组卷积层和池化层的训练损失： 0.0359024

正常情况下的训练精度： 0.99

正常情况下的训练损失： 0.0295332

增加一组卷积层和池化层的训练精度： 0.992

增加一组卷积层和池化层的训练损失： 0.0257643

自己定义CNN网络模型并使用caffe训练的更多相关文章

使用caffe训练自己的CNN
现在有这样的一个场景:给一张行人的小矩形框图片, 根据该行人的特征识别出性别. 分析: (1),行人的姿态各异,变化多端.很难提取图像的特定特征 (2),正常人肉眼判别行人的根据是身材比例,头发长度等 ...
使用caffe训练mnist数据集 - caffe教程实战（一）
个人认为学习一个陌生的框架,最好从例子开始,所以我们也从一个例子开始. 学习本教程之前,你需要首先对卷积神经网络算法原理有些了解,而且安装好了caffe 卷积神经网络原理参考:http://cs231 ...
caffe︱深度学习参数调优杂记+caffe训练时的问题+dropout/batch Normalization
一.深度学习中常用的调节参数本节为笔者上课笔记(CDA深度学习实战课程第一期) 1.学习率步长的选择:你走的距离长短,越短当然不会错过,但是耗时间.步长的选择比较麻烦.步长越小,越容易得到局部最优 ...
caffe训练自己的图片进行分类预测--windows平台
caffe训练自己的图片进行分类预测标签: caffe预测 2017-03-08 21:17 273人阅读评论(0) 收藏举报分类: caffe之旅(4) 版权声明:本文为博主原创文章,未 ...
[caffe] caffe训练tricks
Tags: Caffe Categories: Tools/Wheels --- 1. 将caffe训练时将屏幕输出定向到文本文件 caffe中自带可以画图的工具,在caffe路径下: ./tools ...
实践详细篇-Windows下使用Caffe训练自己的Caffemodel数据集并进行图像分类
三:使用Caffe训练Caffemodel并进行图像分类上一篇记录的是如何使用别人训练好的MNIST数据做训练测试.上手操作一边后大致了解了配置文件属性.这一篇记录如何使用自己准备的图片素材做图像分 ...
Caffe训练AlexNet网络，精度不高或者为0的问题结果
当我们使用Caffe训练AlexNet网络时,会遇到精度一值在低精度(30%左右)升不上去,或者精度总是为0,如下图所示: 出现这种情况,可以尝试使用以下几个方法解决: 1.数据样本量是否太少,最起码 ...
使用Caffe训练适合自己样本集的AlexNet网络模型，并对其进行分类
1.在开始之前,先简单回顾一下几个概念. Caffe(Convolution Architecture For Feature Extraction-卷积神经网络框架):是一个清晰,可读性高,快速的深 ...
Caffe训练AlexNet网络模型——问题三
caffe 进行自己的imageNet训练分类:loss一直是87.3365,accuracy一直是0 解决方法: http://blog.csdn.net/jkfdqjjy/article/deta ...

随机推荐

godoc工具使用
golang除了语言有一定的规范外,对于文档的生成也是非常不错的.仅仅要按go的格式来写的程序,都能够非常easy的生成文档. godoc命令介绍: http://golang.org/cmd/god ...
hdoj--2069--Coin Change（动态规划）
Coin Change Time Limit: 1000/1000 MS (Java/Others) Memory Limit: 32768/32768 K (Java/Others) Tota ...
java多线程 interrupt(), interrupted(), isInterrupted()方法区别
interrupt()方法: 作用是中断线程. 本线程中断自身是被允许的,且"中断标记"设置为true 其它线程调用本线程的interrupt()方法时,会通过checkAcces ...
请求测试——Fiddler2工具(可以测试POST和Get)
使用参考:http://jingyan.baidu.com/article/dca1fa6fa07000f1a44052f6.html 发送POST请求的时候,需要填写发送类型: 发送JSON格式填写 ...
Win32 CRT and MFC 清单文件.manifest配制
Demo.exe.manifest <?xml version="1.0" encoding="UTF-8" standalone="yes&q ...
（转）Django学习之第四章：Django模板系统
前面的章节我们看到如何在视图中返回HTML,但是HTML是硬编码在Python代码中的这会导致几个问题: 1.显然,任何页面的改动会牵扯到Python代码的改动网站的设计改动会比Python代码改 ...
SQL Server 2014 中，新建登录用户，分配权限，并指定该用户的数据
一.运行环境系统:Windows 10数据库:SQL Server 2014数据库名: APP 新建的用户名: app 二.操作步骤 1.打开 MS SQL Server Managemen ...
MDL的一些理解
驱动程序要操作一个用户模式下的内存(32位下小于2G),那么是有风险的,因为用户模式下当前进程的线程不断切换,用户模式下的地址可能会无效.这时的操作将会有未知结果. 用MDL系统API可以将用户模式下 ...
博客移至 GitHub
新博客地址: github.com/FatliTalk/blog
（5）pyspark----共享变量
如果想在节点之间共享一份变量,spark提供了两种特定的共享变量,来完成节点之间的变量共享. (1)广播变量(2)累加器二.广播变量概念: 广播变量允许程序员缓存一个只读的变量在每台机器上,而不是 ...

自己定义CNN网络模型并使用caffe训练

自己定义CNN网络模型并使用caffe训练的更多相关文章

随机推荐

热门专题