Caffe-5.2-（GPU完整流程）训练（依据googlenet微调）

上一篇使用caffenet的模型微调。但由于caffenet有220M太大，測试速度太慢。因此换为googlenet.

1. 训练

迭代了2800次时死机，大概20分钟。

使用的是2000次的模型。

2. 測试

2.1 測试批处理

在F:\caffe-master170309新建例如以下图文件test-TrafficJamBigData03292057.bat。

.\Build\x64\Debug\caffe.exe test --model=models/bvlc_googlenet0329_1/train_val.prototxt -weights=models/bvlc_googlenet0329_1/bvlc_googlenet_iter_2000.caffemodel -gpu=0

pause

效果例如以下：

watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQvZGFza2ExMTA=/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA==/dissolve/70/gravity/Center" alt="">

2.2 測试单张图片

以下用训练出的模型，測试单个图片的准确率。

（參考model的使用）

改Debug\classfication.bat例如以下（測试单张图F:\caffe-master170309\data\TrafficJamBigData03281545\test\du\190416357.png）

通过手动执行可知须要3：67秒。故MFC程序的延时可减少为4秒。

这样比caffenet的11秒快得多了。

只是效果不准：10张图（5张堵、5张不堵）所有识别为不堵，效果例如以下：

watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQvZGFza2ExMTA=/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA==/dissolve/70/gravity/Center" alt="">

上述我觉得是训练的模型不好，故又一次训练。

3. 又一次训练（參考）

以下又一次训练googlenet模型。主要添加迭代次数和batch_size。

3.1 训练数据转lmdb格式和mean文件

因为之前用caffenet时。是以227*227的图片训练的（将crop_size设为227）。用227*227的图片測试的（直接将图由480*480转为了227*227）

此须要用480*480大小的又一次训练。

3.1.1 读取图片的标签，并将图片名+标签写入train_label.txt与test_label.txt里

在F:\caffe-master170309\data\TrafficJamBigData03301009目录里有2个目录、2个*.m，两个空的txt。

得到标签train_label.txt与test_label.txt

3.1.2 转换为lmdb格式

F:\caffe-master170309\Build\x64\Debug下新建convert-TrafficJamBigData03301009-train.bat，内容例如以下：

F:/caffe-master170309/Build/x64/Debug/convert_imageset.exe --shuffle --resize_width=480 --resize_height=480 F:/caffe-master170309/data/TrafficJamBigData03301009/ F:/caffe-master170309/data/TrafficJamBigData03301009/train_label.txt F:/caffe-master170309/data/TrafficJamBigData03301009/TrafficJamBigData03301009-train_lmdb -backend=lmdb

pause

F:\caffe-master170309\Build\x64\Debug下新建convert-TrafficJamBigData03281545-test.bat，内容例如以下：

F:/caffe-master170309/Build/x64/Debug/convert_imageset.exe --shuffle --resize_width=480 --resize_height=480 F:/caffe-master170309/data/TrafficJamBigData03301009/ F:/caffe-master170309/data/TrafficJamBigData03301009/test_label.txt F:/caffe-master170309/data/TrafficJamBigData03301009/TrafficJamBigData03301009-test_lmdb -backend=lmdb

pause

分别执行，效果例如以下。且在F:\caffe-master170309\data\TrafficJamBigData03301009 目录内生成了TrafficJamBigData03301009-train_lmdb和TrafficJamBigData03301009-test_lmdb目录：例如以下：（8个文件）

3.1.3 生成均值文件

F:\caffe-master170309\Build\x64\Debug下新建mean-TrafficJamBigData03301009.bat，内容例如以下：

compute_image_mean.exe F:/caffe-master170309/data/TrafficJamBigData03301009/TrafficJamBigData03301009-train_lmdb mean.binaryproto --backend=lmdb

pause

3.1.4 复制文件

在caffe-master170309/examples下新建TrafficJamBigData03301009目录。

把刚才生成的Debug/mean.binaryproto和F:\caffe-master170309\data\TrafficJamBigData03301009\TrafficJamBigData03301009-train_lmdb和F:\caffe-master170309\data\TrafficJamBigData03301009\TrafficJamBigData03301009-test_lmdb复制到caffe-master170309/examples/TrafficJamBigData03301009里。

改动F:\caffe-master170309\examples\TrafficJamBigData03301009\synset_words.txt为堵与不堵两类（注意budu在第一行，du在第二行，由于要和前面的label.txt相应）

3.1.5 新建文件

在caffe-master170309/examples/TrafficJamBigData03301009里新建

空的RecognizeResultRecordFromCmdTxt.txt

和空的AnalysisOfRecognitionfromCmdTxt.txt

和 synset_words.txt（里面第一行是budu。第二行是du）

效果例如以下：

3.2 改动训练的“參数文件” & “模型结构”

3.2.1 编写训练bat（别急着执行）參考1，參考2，參考我的微调笔记

在F:\caffe-master170309目录下新建一个train-TrafficJamBigData03301009.bat文件。用于训练模型内容例如以下：

.\Build\x64\Debug\caffe.exe  train --solver=models/bvlc_googlenet0329_1/solver.prototxt --weights=models/bvlc_googlenet0329_1/bvlc_googlenet.caffemodel  --gpu 0

pause

3.2.2 參数文件solver.prototxt 參考我的微调笔记

test_iter: 100								#原来1000。改为100

test_interval: 1000							#test_interval: 4000->1000

test_initialization: false

display: 40

average_loss: 40

base_lr: 0.01								#原来base_lr: 0.01

											#来自quick_solver的是      lr_policy: "poly"

											#来自quick_solver的是      power: 0.5

lr_policy: "step"

stepsize: 320000

gamma: 0.96

max_iter: 50000								#max_iter: 10000000->10000

momentum: 0.9

weight_decay: 0.0002

snapshot: 1000								#snapshot: 40000->1000

snapshot_prefix: "models/bvlc_googlenet0329_1/bvlc_googlenet"

solver_mode: GPU

3.2.3 网络模型文件train_val.prototxt 參考我的微调笔记

当中finetune出现error=cudaSuccess(2 vs. 0) out of memory？网上意思是：batch_size改小，将batch_size由原来的32改为2，由原来的50改为2.

（整个网络结构有2000行，仅仅改了前面2层和最后1层），改的部分截取例如以下：

前2层是：

name: "GoogleNet"

layer {

  name: "data"

  type: "Data"

  top: "data"

  top: "label"

  include {

    phase: TRAIN

  }

  transform_param {

    mirror: true			#原来也是true

    crop_size: 480			#原来是224

    mean_value: 104

    mean_value: 117

    mean_value: 123

  }

  data_param {

    source: "data/TrafficJamBigData03281545/TrafficJamBigData03281545-train_lmdb"

    batch_size: 2			#原来是32

    backend: LMDB

  }

}

layer {

  name: "data"

  type: "Data"

  top: "data"

  top: "label"

  include {

    phase: TEST

  }

  transform_param {

    mirror: false

    crop_size: 480			#原来是224

    mean_value: 104

    mean_value: 117

    mean_value: 123

  }

  data_param {

    source: "data/TrafficJamBigData03281545/TrafficJamBigData03281545-test_lmdb"

    batch_size: 2			#原来是50

    backend: LMDB

  }

}

最后1层是：

layer {

  name: "loss3/top-5"

  type: "Accuracy"

  bottom: "loss3/classifier123"	#原来是（3个）：loss3/classifier  loss2/classifier    loss1/classifier

  bottom: "label"

  top: "loss3/top-5"

  include {

    phase: TEST

  }

  accuracy_param {

    top_k: 2					#原来是5

  }

}

3.2.4 測试模型文件deploy.prototxt參考我的微调笔记

改的第1层和倒数第2层。例如以下：

第1层例如以下：

name: "GoogleNet"

layer {

  name: "data"

  type: "Input"

  top: "data"

  input_param { shape: { dim: 10 dim: 3 dim: 480 dim: 480 } }		#  input_param { shape: { dim: 10 dim: 3 dim: 224 dim: 224 } }

}

倒数第二层例如以下：

layer {

  name: "loss3/classifier123"

  type: "InnerProduct"

  bottom: "pool5/7x7_s1"

  top: "loss3/classifier123"

  param {

    lr_mult: 1

    decay_mult: 1

  }

  param {

    lr_mult: 2

    decay_mult: 0

  }

  inner_product_param {

    num_output: 2				#原来是1000

    weight_filler {

      type: "xavier"

    }

    bias_filler {

      type: "constant"

      value: 0

    }

  }

}

layer {

  name: "prob"

  type: "Softmax"

  bottom: "loss3/classifier123"

  top: "prob"

}

3.2.5 执行F:\caffe-master170309\train-TrafficJamBigData03301009.bat文件，開始训练

1200张图（1200张训练+200张測试），迭代50000次，batch_size由“32和50”改为“2和2”

训练记录例如以下：

11:54開始。

iter40次，14秒。

推算的话

iter50000次，5小时。

Caffe-5.2-（GPU完整流程）训练（依据googlenet微调）的更多相关文章

Grunt搭建自动化web前端开发环境--完整流程
Grunt搭建自动化web前端开发环境-完整流程 jQuery在使用grunt,bootstrap在使用grunt,百度UEditor在使用grunt,你没有理由不学.不用! 1. 前言各位web前 ...
Windows 10下安装配置Caffe并支持GPU加速(修改版)
基本环境建议严格按照版本来 - Windows 10 - Visual Studio 2013 - Matlab R2016b - Anaconda - CUDA 8.0.44 - cuDNN v4 ...
单点登录(十三)-----实战-----cas4.2.X登录启用mongodb验证方式完整流程
我们在之前的文章中中已经讲到了正确部署运行cas server 和在cas client中配置. 在此基础上我们去掉了https的验证,启用了http访问的模式. 单点登录(七)-----实战-- ...
jquery ajax thinkphp异步局部刷新完整流程
环境:ThinkPHP3.2.3,jQuery3.2 前言: 在一般的网站中,都需要用到jquery或者其他框架(比如angular)来处理前后端数据交互,thinkphp在后台也内置了一些函数用 ...
onvif获取摄像头的流媒体地址完整流程
linux设备上的Onvif 实现6:获取摄像头的流媒体地址完整流程整体流程: Probe: 发现网络摄像头,获取webserver地址 http://192.168.15.240/onvif/de ...
m_Orchestrate learning system---三、session使用完整流程是什么
m_Orchestrate learning system---三.session使用完整流程是什么一.总结一句话总结: 1.在登录成功之后设置session和cookie 2.在公共控制器里面使 ...
TensorFlow指定GPU/CPU进行训练和输出devices信息
TensorFlow指定GPU/CPU进行训练和输出devices信息 1.在tensorflow代码中指定GPU/CPU进行训练 with tf.device('/gpu:0'): .... wit ...
深入理解java：4.3.1. 框架编程之MyBatis---SQL语句执行的完整流程
Mybatis的整个的执行流程.如下图所示: 原理详解: MyBatis应用程序根据XML配置文件创建SqlSessionFactory, SqlSessionFactory在根据配置,配置来源于两个 ...
fidder抓包工具使用方法，完整流程
fidder抓包工具使用方法,完整流程 https://blog.csdn.net/lw545034502/article/details/82150779 版权声明:本文为博主原创文章,遵循 CC ...

随机推荐

JAVAscript学习笔记 js条件语句第三节（原创）参考js使用表 (2017-09-14 15:55)
<!DOCTYPE html> <html lang="en"> <head> <meta charset="UTF-8&quo ...
C#线程调用带参数的方法
在 .NET Framework 2.0 版中,要实现线程调用带参数的方法有两种办法.第一种:使用ParameterizedThreadStart.调用 System.Threading.Thread ...
[转载] Hadoop MapReduce
转载自http://blog.csdn.net/yfkiss/article/details/6387613和http://blog.csdn.net/yfkiss/article/details/6 ...
CLR类型设计之泛型（一）
在讨论泛型之前,我们先讨论一下在没有泛型的世界里,如果我们想要创建一个独立于被包含类型的类和方法,我们需要定义objece类型,但是使用object就要面对装箱和拆箱的操作,装箱和拆箱会很损耗性能,我 ...
javascript第八章--事件
① 事件流 ② 事件处理程序 ③ 事件对象 ④ 事件类型 ⑤ 内存和性能 ⑥ 模拟事件
基础5.jQuery常用事件
jQuery常用事件 1.bind() 方法 :为被选元素添加一个或多个事件处理程序,并规定事件发生时运行的函数. 2.blur() 方法:当元素失去焦点时发生 blur 事件. 3.change() ...
java SE 基础概念梳理（一）
(一)First 摘要:Java概述.Java开发环境搭建.程序开发流程 Java概述 Java的应用开发QQ.迅雷程序(桌面应用软件)开发淘宝.京东(互联网应用软件) Java的擅长互联网: ...
前端框架对于未来web移动端的影响
现在前端框架市场比较乱,各种各样的框架参差不齐,这给我带来了很多困惑,同样是很多朋友的困惑吧!因为前端框架有很多种,对于程序员来说选择学习是非常困难的,不可能有几十上百种都要学习吧,不过最好的办法就是 ...
一个可扩展的深度学习框架的Python实现（仿keras接口）
一个可扩展的深度学习框架的Python实现(仿keras接口) 动机 keras是一种非常优秀的深度学习框架,其具有较好的易用性,可扩展性.keras的接口设计非常优雅,使用起来非常方便.在这里,我将 ...
机器学习实验一SVM分类实验
一.实验目的和内容 (一)实验目的 1.熟悉支持向量机SVM(Support Vector Machine)模型分类算法的使用. 2.用svm-train中提供的代码框架(填入SVM分类器代码)用tr ...

Caffe-5.2-（GPU完整流程）训练（依据googlenet微调）

3.1.1 读取图片的标签，并将图片名+标签写入train_label.txt与test_label.txt里

Caffe-5.2-（GPU完整流程）训练（依据googlenet微调）的更多相关文章

随机推荐

热门专题