Caffe-5.2-(GPU完整流程)训练(依据googlenet微调)
上一篇使用caffenet的模型微调。但由于caffenet有220M太大,測试速度太慢。因此换为googlenet.
1. 训练
迭代了2800次时死机,大概20分钟。
使用的是2000次的模型。
2. 測试
2.1 測试批处理
在F:\caffe-master170309新建例如以下图文件test-TrafficJamBigData03292057.bat。
.\Build\x64\Debug\caffe.exe test --model=models/bvlc_googlenet0329_1/train_val.prototxt -weights=models/bvlc_googlenet0329_1/bvlc_googlenet_iter_2000.caffemodel -gpu=0
pause
效果例如以下:
watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQvZGFza2ExMTA=/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA==/dissolve/70/gravity/Center" alt="">
2.2 測试单张图片
以下用训练出的模型,測试单个图片的准确率。
(參考model的使用)
改Debug\classfication.bat例如以下(測试单张图F:\caffe-master170309\data\TrafficJamBigData03281545\test\du\190416357.png)
通过手动执行可知须要3:67秒。故MFC程序的延时可减少为4秒。
这样比caffenet的11秒快得多了。
只是效果不准:10张图(5张堵、5张不堵)所有识别为不堵,效果例如以下:
watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQvZGFza2ExMTA=/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA==/dissolve/70/gravity/Center" alt="">
上述我觉得是训练的模型不好,故又一次训练。
3. 又一次训练 (參考)
以下又一次训练googlenet模型。主要添加迭代次数和batch_size。
3.1 训练数据转lmdb格式和mean文件
因为之前用caffenet时。是以227*227的图片训练的(将crop_size设为227)。用227*227的图片測试的(直接将图由480*480转为了227*227)
此须要用480*480大小的又一次训练。
3.1.1 读取图片的标签,并将图片名+标签写入train_label.txt与test_label.txt里
F:\caffe-master170309\Build\x64\Debug下新建convert-TrafficJamBigData03301009-train.bat,内容例如以下:
F:/caffe-master170309/Build/x64/Debug/convert_imageset.exe --shuffle --resize_width=480 --resize_height=480 F:/caffe-master170309/data/TrafficJamBigData03301009/ F:/caffe-master170309/data/TrafficJamBigData03301009/train_label.txt F:/caffe-master170309/data/TrafficJamBigData03301009/TrafficJamBigData03301009-train_lmdb -backend=lmdb
pause
F:/caffe-master170309/Build/x64/Debug/convert_imageset.exe --shuffle --resize_width=480 --resize_height=480 F:/caffe-master170309/data/TrafficJamBigData03301009/ F:/caffe-master170309/data/TrafficJamBigData03301009/test_label.txt F:/caffe-master170309/data/TrafficJamBigData03301009/TrafficJamBigData03301009-test_lmdb -backend=lmdb
pause
F:\caffe-master170309\Build\x64\Debug下新建mean-TrafficJamBigData03301009.bat,内容例如以下:
compute_image_mean.exe F:/caffe-master170309/data/TrafficJamBigData03301009/TrafficJamBigData03301009-train_lmdb mean.binaryproto --backend=lmdb
pause
3.1.4 复制文件
在caffe-master170309/examples下新建TrafficJamBigData03301009目录。
把刚才生成的Debug/mean.binaryproto和F:\caffe-master170309\data\TrafficJamBigData03301009\TrafficJamBigData03301009-train_lmdb和F:\caffe-master170309\data\TrafficJamBigData03301009\TrafficJamBigData03301009-test_lmdb复制到caffe-master170309/examples/TrafficJamBigData03301009里。
改动F:\caffe-master170309\examples\TrafficJamBigData03301009\synset_words.txt为堵与不堵两类(注意budu在第一行,du在第二行,由于要和前面的label.txt相应)
3.1.5 新建文件
在caffe-master170309/examples/TrafficJamBigData03301009里新建
空的RecognizeResultRecordFromCmdTxt.txt
和 空的AnalysisOfRecognitionfromCmdTxt.txt
和 synset_words.txt(里面第一行是budu。第二行是du)
效果例如以下:
3.2 改动训练的“參数文件” & “模型结构”
3.2.1 编写训练bat(别急着执行) 參考1,參考2,參考我的微调笔记
在F:\caffe-master170309目录下新建一个train-TrafficJamBigData03301009.bat文件。用于训练模型内容例如以下:
.\Build\x64\Debug\caffe.exe train --solver=models/bvlc_googlenet0329_1/solver.prototxt --weights=models/bvlc_googlenet0329_1/bvlc_googlenet.caffemodel --gpu 0
pause
3.2.2 參数文件solver.prototxt 參考我的微调笔记
test_iter: 100 #原来1000。改为100
test_interval: 1000 #test_interval: 4000->1000
test_initialization: false
display: 40
average_loss: 40
base_lr: 0.01 #原来base_lr: 0.01
#来自quick_solver的是 lr_policy: "poly"
#来自quick_solver的是 power: 0.5
lr_policy: "step"
stepsize: 320000
gamma: 0.96
max_iter: 50000 #max_iter: 10000000->10000
momentum: 0.9
weight_decay: 0.0002
snapshot: 1000 #snapshot: 40000->1000
snapshot_prefix: "models/bvlc_googlenet0329_1/bvlc_googlenet"
solver_mode: GPU
3.2.3 网络模型文件train_val.prototxt 參考我的微调笔记
当中finetune出现error=cudaSuccess(2 vs. 0) out of memory?网上意思是:batch_size改小,将batch_size由原来的32改为2,由原来的50改为2.
(整个网络结构有2000行,仅仅改了前面2层和最后1层),改的部分截取例如以下:
前2层是:
name: "GoogleNet"
layer {
name: "data"
type: "Data"
top: "data"
top: "label"
include {
phase: TRAIN
}
transform_param {
mirror: true #原来也是true
crop_size: 480 #原来是224
mean_value: 104
mean_value: 117
mean_value: 123
}
data_param {
source: "data/TrafficJamBigData03281545/TrafficJamBigData03281545-train_lmdb"
batch_size: 2 #原来是32
backend: LMDB
}
}
layer {
name: "data"
type: "Data"
top: "data"
top: "label"
include {
phase: TEST
}
transform_param {
mirror: false
crop_size: 480 #原来是224
mean_value: 104
mean_value: 117
mean_value: 123
}
data_param {
source: "data/TrafficJamBigData03281545/TrafficJamBigData03281545-test_lmdb"
batch_size: 2 #原来是50
backend: LMDB
}
}
最后1层是:
layer {
name: "loss3/top-5"
type: "Accuracy"
bottom: "loss3/classifier123" #原来是(3个):loss3/classifier loss2/classifier loss1/classifier
bottom: "label"
top: "loss3/top-5"
include {
phase: TEST
}
accuracy_param {
top_k: 2 #原来是5
}
}
3.2.4 測试模型文件deploy.prototxt參考我的微调笔记
改的第1层和倒数第2层。例如以下:
第1层例如以下:
name: "GoogleNet"
layer {
name: "data"
type: "Input"
top: "data"
input_param { shape: { dim: 10 dim: 3 dim: 480 dim: 480 } } # input_param { shape: { dim: 10 dim: 3 dim: 224 dim: 224 } }
}
倒数第二层例如以下:
layer {
name: "loss3/classifier123"
type: "InnerProduct"
bottom: "pool5/7x7_s1"
top: "loss3/classifier123"
param {
lr_mult: 1
decay_mult: 1
}
param {
lr_mult: 2
decay_mult: 0
}
inner_product_param {
num_output: 2 #原来是1000
weight_filler {
type: "xavier"
}
bias_filler {
type: "constant"
value: 0
}
}
}
layer {
name: "prob"
type: "Softmax"
bottom: "loss3/classifier123"
top: "prob"
}
3.2.5 执行F:\caffe-master170309\train-TrafficJamBigData03301009.bat文件,開始训练
1200张图(1200张训练+200张測试),迭代50000次,batch_size由“32和50”改为“2和2”
训练记录例如以下:
11:54開始。
iter40次,14秒。
推算的话
iter50000次,5小时。
Caffe-5.2-(GPU完整流程)训练(依据googlenet微调)的更多相关文章
- Grunt搭建自动化web前端开发环境--完整流程
Grunt搭建自动化web前端开发环境-完整流程 jQuery在使用grunt,bootstrap在使用grunt,百度UEditor在使用grunt,你没有理由不学.不用! 1. 前言 各位web前 ...
- Windows 10下安装配置Caffe并支持GPU加速(修改版)
基本环境 建议严格按照版本来 - Windows 10 - Visual Studio 2013 - Matlab R2016b - Anaconda - CUDA 8.0.44 - cuDNN v4 ...
- 单点登录(十三)-----实战-----cas4.2.X登录启用mongodb验证方式完整流程
我们在之前的文章中中已经讲到了正确部署运行cas server 和 在cas client中配置. 在此基础上 我们去掉了https的验证,启用了http访问的模式. 单点登录(七)-----实战-- ...
- jquery ajax thinkphp异步局部刷新完整流程
环境:ThinkPHP3.2.3,jQuery3.2 前言: 在一般的网站中,都需要用到jquery或者其他框架(比如angular)来处理前后端数据交互,thinkphp在后台也内置了一些函数用 ...
- onvif获取摄像头的流媒体地址完整流程
linux设备上的Onvif 实现6:获取摄像头的流媒体地址完整流程 整体流程: Probe: 发现网络摄像头,获取webserver地址 http://192.168.15.240/onvif/de ...
- m_Orchestrate learning system---三、session使用完整流程是什么
m_Orchestrate learning system---三.session使用完整流程是什么 一.总结 一句话总结: 1.在登录成功之后设置session和cookie 2.在公共控制器里面使 ...
- TensorFlow指定GPU/CPU进行训练和输出devices信息
TensorFlow指定GPU/CPU进行训练和输出devices信息 1.在tensorflow代码中指定GPU/CPU进行训练 with tf.device('/gpu:0'): .... wit ...
- 深入理解java:4.3.1. 框架编程之MyBatis---SQL语句执行的完整流程
Mybatis的整个的执行流程.如下图所示: 原理详解: MyBatis应用程序根据XML配置文件创建SqlSessionFactory, SqlSessionFactory在根据配置,配置来源于两个 ...
- fidder抓包工具使用方法,完整流程
fidder抓包工具使用方法,完整流程 https://blog.csdn.net/lw545034502/article/details/82150779 版权声明:本文为博主原创文章,遵循 CC ...
随机推荐
- 使用Lock锁生产者消费者模式
package com.java.concurrent; import java.util.concurrent.locks.Condition; import java.util.concurren ...
- AngularJS学习篇(十)
AngularJS Select(选择框) 使用 ng-options 创建选择框 在 AngularJS 中我们可以使用 ng-option 指令来创建一个下拉列表,列表项通过对象和数组循环输出,如 ...
- Netty——简单创建服务器、客户端通讯
Netty 是一个基于NIO的客户.服务器端编程框架,使用Netty 可以确保你快速和简单的开发出一个网络应用,例如实现了某种协议的客户,服务端应用.Netty相当简化和流线化了网络应用的编程开发过程 ...
- nohup和&后台运行,查看占用端口进程
1.nohup 用途:不挂断地运行命令. 语法:nohup Command [ Arg - ] [ & ] 无论是否将 nohup 命令的输出重定向到终端,输出都将附加到当前目录的 nohup ...
- MyEclipse下安装FatJar打包工具
方法一:help > software updates > Find and install > add > add remote site name:FatJar url:h ...
- [转载] Linux内存管理之mmap详解
转载自http://blog.chinaunix.net/uid-26669729-id-3077015.html 一. mmap系统调用 1. mmap系统调用 mmap将一个文件或者其它对象映射进 ...
- Storm入门之第一章
Storm入门之第一章 1.名词 spout龙卷,读取原始数据为bolt提供数据 bolt雷电,从spout或者其他的bolt接收数据,并处理数据,处理结果可作为其他bolt的数据源或最终结果 nim ...
- Mysql 用法
一转眼,一个星期过去了,来到测试班也一个星期了,今天经历了一次,这是自己这一周的总结,也算对自己这一周的一个交代. 几个比较重要的语句: 查看数据库 show databases; 创建数据库 cre ...
- NOIP2017-普及组复赛第2题 题解
Description 图书馆中每本书都有一个图书编码,可以用于快速检索图书,这个图书编码是一个正整数. 每位借书的读者手中有一个需求码,这个需求码也是一个正整数.如果一本书的图书编码恰好以读者的需 ...
- MyRapid WinForm 快速开发框架
MyRapid 框架介绍开发历程:作者是数据库相关软件开发从业人员,懒惰的,能交给电脑做的事情懒得自己做开发目的:处理底层数据传输,减少工作量,提高开发效率框架特点:数据库相关开发.易学易用.快速上手 ...