【神经网络与深度学习】在Windows8.1上用VS2013编译Caffe并训练和分类自己的图片
最近想熟悉一下深度学习,体验了一下Caffe,简单写写训练和分类的过程:
1.下载Caffe VS2013工程:https://github.com/Microsoft/caffe
2. 解压并用VS2013打开解决方案caffe-master\windows\Caffe.sln,默认配置是x64 Debug
2. 重命名caffe-master\windows\CommonSettings.props.example为caffe-master\windows\CommonSettings.props,然后修改如下配置:
<CpuOnlyBuild>true</CpuOnlyBuild> ----- 是否使用GPU,我的电脑没有GPU,所以为true
<UseCuDNN>false</UseCuDNN> ----- 是否使用CuDNN库
<PythonSupport>false</PythonSupport> ----- 是否支持Python
<MatlabSupport>false</MatlabSupport> ----- 是否支持Matlab
4. 编译解决方案
全编译整个解决方案,刚开始会弹出一个窗口下载第三方库,需要下载一段时间,下载完毕后开始编译。第一次编译或许会出现错误说找不到libcaffe.lib,把工程libcaffe单独编译一下然后再编译整个解决方案即可。
5.编译通过后,在caffe-master\Build\x64\Debug中会出现一堆exe和dll:
convert_imageset.exe 用来生成训练图片和测试图片的数据库
compute_image_mean.exe 计算训练图片的均值
classification.exe 对目标图片分类
6. 准备训练图片和测试图片,我们这里训练圆形,三角形,六边形和云朵图片,比如:
caffe-master\data\train\circle中放圆形练图片10张
caffe-master\data\train\cloud中放云朵形状练图片5张
caffe-master\data\train\hexagon中放六边形练图片5张
caffe-master\data\train\triangle中放三角形练图片10张
训练图片共30张
caffe-master\data\train\val中放测试图片
这里放两张圆形图片(标准圆形和手绘圆形),两张三角形(标准+手绘),一张标准六边形,一张云朵图片,共6张
7. 新建文本文件caffe-master\data\train\train.txt,填写将30张训练图片和类别编号对应关系,内容如下,jpg后面的数字表示图片类别编号,从0开始。
\circle\1.jpg 0
\circle\2.jpg 0
\circle\3.jpg 0
\circle\4.jpg 0
\circle\5.jpg 0
\circle\6.jpg 0
\circle\7.jpg 0
\circle\8.jpg 0
\circle\9.jpg 0
\circle\10.jpg 0
\triangle\1.jpg 1
\triangle\2.jpg 1
\triangle\3.jpg 1
\triangle\4.jpg 1
\triangle\5.jpg 1
\triangle\6.jpg 1
\triangle\7.jpg 1
\triangle\8.jpg 1
\triangle\9.jpg 1
\triangle\10.jpg 1
\hexagon\1.jpg 2
\hexagon\2.jpg 2
\hexagon\3.jpg 2
\hexagon\4.jpg 2
\hexagon\5.jpg 2
\cloud\a.jpg 3
\cloud\b.jpg 3
\cloud\c.jpg 3
\cloud\d.jpg 3
\cloud\e.jpg 3
注意:这里每行的文件名称会和第9节convert_imageset_train.bat的行“set a=C:\xxx\caffe-master\data\train”指定的路径拼接成一个完整图片文件路径
8. 新建文本文件caffe-master\data\val\val.txt,填写测试图片和类别编号的对应关系,内容如下,格式与上面train.txt一样:
\1.jpg 0
\a.jpg 0
\2.jpg 1
\b.jpg 1
\3.jpg 2
\5.jpg 3
注意:这里每行的图片文件名称会和第10节convert_imageset_val.bat的行“set a=C:\xxx\caffe-master\data\val”指定的路径拼接成一个完整图片文件路径
9. 在caffe-master根目录下新建并运行批处理文件convert_imageset_train.bat,用于生成训练图片数据库:
文件内容如下:
SET GLOG_logtostderr=1
cd /d C:\xxx\caffe-master
set a=C:\xxx\caffe-master\data\train
set b=C:\xxx\caffe-master\data\train\train.txt
set c=C:\xxx\caffe-master\data\trainlmdb
Build\x64\Debug\convert_imageset.exe -resize_height=200 -resize_width=200 %a% %b% %c% 0
pause
注意:运行此批处理文件前要确保文件夹caffe-master\data\trainlmdb不存在,否则会报错。
批处理运行后生成两个文件:caffe-master\data\trainlmdb\data.mdb和caffe-master\data\trainlmdb\lock.mdb
10. 在caffe-master根目录下新建并运行批处理文件convert_imageset_val.bat,用于生成测试图片数据库,文件内容如下:
SET GLOG_logtostderr=1
cd /d C:\xxx\caffe-master
set a=C:\xxx\caffe-master\data\val
set b=C:\ xxx\caffe-master\data\val\val.txt
set c=C:\xxx\caffe-master\data\vallmdb
Build\x64\Debug\convert_imageset.exe -resize_height=200 -resize_width=200 %a% %b% %c% 0
pause
注意:运行此批处理文件前要确保文件夹caffe-master\data\vallmdb不存在,否则会报错。
resize_height和resize_width分别为调整后的输入图片的宽度和高度
批处理运行后生成两个文件:caffe-master\data\vallmdb\data.mdb和caffe-master\data\vallmdb\lock.mdb
11. 生成均值文件,在caffe-master根目录下新建并运行批处理文件compute_image_mean.bat
SET GLOG_logtostderr=1
cd /d C:\xxx\caffe-master
set a=C:\xxx\caffe-master\data\trainlmdb
set b=C:\xxx\caffe-master\data\image_mean.binaryproto
Build\x64\Debug\compute_image_mean.exe %a% %b%
pause
批处理运行后生成caffe-master\data\image_mean.binaryproto
12. 复制文件caffe-master\models\bvlc_alexnet\solver.prototxt和caffe-master\models\bvlc_alexnet\train_val.prototxt到caffe-master\data,并修改如下:
solver.prototxt:
net: "C:/xxx/caffe-master/data/train_val.prototxt"
test_iter: 1
test_interval: 500
base_lr: 0.001
lr_policy: "step"
gamma: 0.1
stepsize: 100000
display: 20
max_iter: 10000
momentum: 0.9
weight_decay: 0.0005
snapshot: 1000
snapshot_prefix: "models/bvlc_alexnet/caffe_alexnet_train"
solver_mode: CPU
solver.prototxt和train_val.prototxt的详细介绍请参考如下两篇博客:
13. 在caffe-master根目录下新建并运行批处理文件train.bat开始训练:
SET GLOG_logtostderr=1
cd /d C:\xxx\caffe-master
Build\x64\Debug\caffe.exe train --solver=C:\xxx\caffe-master\data\solver.prototxt
pause
训练结果和快照保存在caffe-master\models\bvlc_alexnet中。
14. 由于使用CPU计算,训练速度非常慢,不知道采用GPU能加速多少,减少训练图片数量和图片尺寸(step9和10中的resize_height和resize_width)能加快训练速度和降低内存使用。经过数个小时的等待训练结束,生成最终的训练结果,也可使用训练中间生成的快照来做分类。
15. 在caffe-master根目录下新建并运行批处理文件classification.bat开始分类。
SET GLOG_logtostderr=1
cd /d C:\xxx\caffe-master
set a=C:\xxx\caffe-master\models\bvlc_alexnet\deploy.prototxt
set b=C:\xxx\caffe-master\models\bvlc_alexnet\caffe_alexnet_train_iter_4000.caffemodel
set c=C:\xxx\caffe-master\data\image_mean.binaryproto
set d=C:\xxx\caffe-master\labels.txt
set e=C:\xxx\caffe-master\data\val\f.jpg
Build\x64\Debug\classification.exe %a% %b% %c% %d% %e%
pause
参数说明:
deploy.prototxt:
修改name为data的layer中的input_param为{ shape: { dim: 10 dim: 3 dim: 200 dim: 200 } } 其中的200分别对应step9和10中的resize_height和resize_width
在name为fc8的layer中,修改num_output的值为4(训练图片类型的个数)
caffe_alexnet_train_iter_4000.caffemodel: 训练结果
image_mean.binaryproto: 均值文件
labels.txt: 图片类型编号对应的类型名称文件,一行一个名称
f.jpg: 待分类的图片
14. 手绘一个云朵形状的图片然后分类,结果:
0.9997 - "cloud"
0.0002 - "triangle
0.0001 - "hexagon"
0.0000 - "circle"
【神经网络与深度学习】在Windows8.1上用VS2013编译Caffe并训练和分类自己的图片的更多相关文章
- 【神经网络与深度学习】如何将别人训练好的model用到自己的数据上
caffe团队用imagenet图片进行训练,迭代30多万次,训练出来一个model.这个model将图片分为1000类,应该是目前为止最好的图片分类model了. 假设我现在有一些自己的图片想进行分 ...
- (转)神经网络和深度学习简史(第一部分):从感知机到BP算法
深度|神经网络和深度学习简史(第一部分):从感知机到BP算法 2016-01-23 机器之心 来自Andrey Kurenkov 作者:Andrey Kurenkov 机器之心编译出品 参与:chen ...
- [DeeplearningAI笔记]神经网络与深度学习人工智能行业大师访谈
觉得有用的话,欢迎一起讨论相互学习~Follow Me 吴恩达采访Geoffrey Hinton NG:前几十年,你就已经发明了这么多神经网络和深度学习相关的概念,我其实很好奇,在这么多你发明的东西中 ...
- 【吴恩达课后测验】Course 1 - 神经网络和深度学习 - 第二周测验【中英】
[中英][吴恩达课后测验]Course 1 - 神经网络和深度学习 - 第二周测验 第2周测验 - 神经网络基础 神经元节点计算什么? [ ]神经元节点先计算激活函数,再计算线性函数(z = Wx + ...
- 【吴恩达课后测验】Course 1 - 神经网络和深度学习 - 第一周测验【中英】
[吴恩达课后测验]Course 1 - 神经网络和深度学习 - 第一周测验[中英] 第一周测验 - 深度学习简介 和“AI是新电力”相类似的说法是什么? [ ]AI为我们的家庭和办公室的个人设备供电 ...
- 如何理解归一化(Normalization)对于神经网络(深度学习)的帮助?
如何理解归一化(Normalization)对于神经网络(深度学习)的帮助? 作者:知乎用户链接:https://www.zhihu.com/question/326034346/answer/730 ...
- 【神经网络与深度学习】卷积神经网络(CNN)
[神经网络与深度学习]卷积神经网络(CNN) 标签:[神经网络与深度学习] 实际上前面已经发布过一次,但是这次重新复习了一下,决定再发博一次. 说明:以后的总结,还应该以我的认识进行总结,这样比较符合 ...
- 【神经网络与深度学习】【python开发】caffe-windows使能python接口使用draw_net.py绘制网络结构图过程
[神经网络与深度学习][python开发]caffe-windows使能python接口使用draw_net.py绘制网络结构图过程 标签:[神经网络与深度学习] [python开发] 主要是想用py ...
- 【神经网络与深度学习】【Qt开发】【VS开发】从caffe-windows-visual studio2013到Qt5.7使用caffemodel进行分类的移植过程
[神经网络与深度学习][CUDA开发][VS开发]Caffe+VS2013+CUDA7.5+cuDNN配置成功后的第一次训练过程记录<二> 标签:[神经网络与深度学习] [CUDA开发] ...
随机推荐
- 在Nginx中使用Godaddy的SSL证书
首先在Godaddy付款购买SSL证书,成功之后打开管理面板,找到刚购买的SSL证书,点击新建证书,这个时候Godaddy会让提供CSR文件内容,可以通过下面的命令行生成csr内容: openssl ...
- 编程语言类别;运行Python程序的方式;变量和常量;Python程序的垃圾回收机制;
目录 编程语言分类 运行Python程序的两种方式 1.交互式 变量与常量 1.变量 2.常量 3.小整数池 垃圾回收机制 编程语言分类 编程语言分为: 1.机器语言:直接用二进制的0和1和计算机(C ...
- Dubbo配置文件详解
为新项目练手,把项目中用到的web service.RMI的服务改用Dubbo+Zookeeper+Spring,网上找到几篇不错的配置详解 1.此篇博文主要从以下几种配置方式来讲 XML 配置文件方 ...
- EasyUI ComboBox ajax
ajax请求数据 $.post("get_select", { "type1" : "mytype" }, function(data) { ...
- codevs 1231 最优布线问题 x(find函数要从娃娃抓起系列)
题目描述 Description 学校需要将n台计算机连接起来,不同的2台计算机之间的连接费用可能是不同的.为了节省费用,我们考虑采用间接数据传输结束,就是一 ...
- pycharm2018.3 x64激活
今天把pycharm从2018.2.4更新到了2018.3.7,需要重新激活,激活方式如下: 1.修改hosts文件,将下面两句话添加到hosts文件,保存 0.0.0.0 account.jetbr ...
- 试用saucelabs进行浏览器兼容性测试
Hi,all 跟大家分享下saucelabs,一个云测试平台,支持PC和手机(自带的)浏览器的兼容性测试,并且支持selenium/appium的自动化测试,不过是收费的,价格还挺贵,但是人工的测试是 ...
- django + jquery 实现二级联动
二级联动用ajax还是很好实现的,下面简单给个例子 jquery代码 $("#id_sel").change(function(){ $.get("/browser/ge ...
- You Are Given a Decimal String...
B. You Are Given a Decimal String... 这个题需要求出从某一个尾数 n 变为 m 所需要的 x 和 y 的最小个数(i+j) 那么就需要预处理出一个数组来存放这个值. ...
- php 将几个变量合为数组,变量名和值对应
<?php $firstname = "Bill"; $lastname = "Gates"; $age = "60"; $resul ...