caffe的python接口学习（1）：生成配置文件

caffe是C++语言写的，可能很多人不太熟悉，因此想用更简单的脚本语言来实现。caffe提供matlab接口和python接口，这两种语言就非常简单，而且非常容易进行可视化，使得学习更加快速，理解更加深入。

半年前，我在学习CAFFE的时候，为了加深理解，因此写下了随笔，有了一系列的caffe学习文章。半年过去，很多人问到关于python接口和可视化的一些问题，现在有点空闲时间，就再次写下一些随笔，大家一起来学习。有些重复的内容，我就不再多讲，如果大家有兴趣可移步：

如何配置CAFFE的python接口？

如何将图片转换成LMDB文件？

如何计算训练数据的均值文件？

以上这些操作都是训练之前的预处理操作，不管是用什么接口，都要用到。

首先，我们需要掌握的，就是如何写配置文件，通过下面的代码来学习：

# -*- coding: utf-8 -*-

"""

Spyder Editor

"""

from caffe import layers as L,params as P,to_proto

path='/home/xxx/data/'                    #保存数据和配置文件的路径

train_lmdb=path+'train_db'                #训练数据LMDB文件的位置

val_lmdb=path+'val_db'                    #验证数据LMDB文件的位置

mean_file=path+'mean.binaryproto'         #均值文件的位置

train_proto=path+'train.prototxt'         #生成的训练配置文件保存的位置

val_proto=path+'val.prototxt'             #生成的验证配置文件保存的位置

#编写一个函数，用于生成网络

def create_net(lmdb,batch_size,include_acc=False):

    #创建第一层：数据层。向上传递两类数据：图片数据和对应的标签

    data, label = L.Data(source=lmdb, backend=P.Data.LMDB, batch_size=batch_size, ntop=2,

        transform_param=dict(crop_size=40,mean_file=mean_file,mirror=True))

    #创建第二屋：卷积层

    conv1=L.Convolution(data, kernel_size=5, stride=1,num_output=16, pad=2,weight_filler=dict(type='xavier'))

    #创建激活函数层

    relu1=L.ReLU(conv1, in_place=True)

    #创建池化层

    pool1=L.Pooling(relu1, pool=P.Pooling.MAX, kernel_size=3, stride=2)

    conv2=L.Convolution(pool1, kernel_size=3, stride=1,num_output=32, pad=1,weight_filler=dict(type='xavier'))

    relu2=L.ReLU(conv2, in_place=True)

    pool2=L.Pooling(relu2, pool=P.Pooling.MAX, kernel_size=3, stride=2)

    #创建一个全连接层

    fc3=L.InnerProduct(pool2, num_output=1024,weight_filler=dict(type='xavier'))

    relu3=L.ReLU(fc3, in_place=True)

    #创建一个dropout层

    drop3 = L.Dropout(relu3, in_place=True)

    fc4 = L.InnerProduct(drop3, num_output=10,weight_filler=dict(type='xavier'))
    #创建一个softmax层

    loss = L.SoftmaxWithLoss(fc4, label)

    if include_acc:             #在训练阶段，不需要accuracy层，但是在验证阶段，是需要的

        acc = L.Accuracy(fc4, label)

        return to_proto(loss, acc)

    else:

        return to_proto(loss)

def write_net():

    #将以上的设置写入到prototxt文件

    with open(train_proto, 'w') as f:

        f.write(str(create_net(train_lmdb,batch_size=64)))

    #写入配置文件

    with open(val_proto, 'w') as f:

        f.write(str(create_net(val_lmdb,batch_size=32, include_acc=True)))

if __name__ == '__main__':

    write_net()

通过上面这个文件的执行，我们就会得到两个配置文件：train.prototxt和val.prototxt，分别用于训练阶段和验证阶段。

这种方式生成配置文件，必须有个前提，就是要先把原始图片转换成LMDB文件才行。如果我们已经把原始图片做成了一个列表清单（txt文件，一行一张图片），则可以不用LMDB格式作为输入数据，可以用ImageData作为数据源输入，代码如下：

# -*- coding: utf-8 -*-

from caffe import layers as L,params as P,to_proto

path='/home/xxx/data/'

train_list=path+'train.txt'

val_list=path+'val.txt'

train_proto=path+'train.prototxt'

val_proto=path+'val.prototxt'       

def create_net(img_list,batch_size,include_acc=False):

    data,label=L.ImageData(source=img_list,batch_size=batch_size,new_width=48,new_height=48,ntop=2,

                           transform_param=dict(crop_size=40,mirror=True))

    conv1=L.Convolution(data, kernel_size=5, stride=1,num_output=16, pad=2,weight_filler=dict(type='xavier'))

    relu1=L.ReLU(conv1, in_place=True)

    pool1=L.Pooling(relu1, pool=P.Pooling.MAX, kernel_size=3, stride=2)

    conv2=L.Convolution(pool1, kernel_size=53, stride=1,num_output=32, pad=1,weight_filler=dict(type='xavier'))

    relu2=L.ReLU(conv2, in_place=True)

    pool2=L.Pooling(relu2, pool=P.Pooling.MAX, kernel_size=3, stride=2)

    conv3=L.Convolution(pool2, kernel_size=53, stride=1,num_output=32, pad=1,weight_filler=dict(type='xavier'))

    relu3=L.ReLU(conv3, in_place=True)

    pool3=L.Pooling(relu3, pool=P.Pooling.MAX, kernel_size=3, stride=2)

    fc4=L.InnerProduct(pool3, num_output=1024,weight_filler=dict(type='xavier'))

    relu4=L.ReLU(fc4, in_place=True)

    drop4 = L.Dropout(relu4, in_place=True)

    fc5 = L.InnerProduct(drop4, num_output=7,weight_filler=dict(type='xavier'))

    loss = L.SoftmaxWithLoss(fc5, label)

    if include_acc:

        acc = L.Accuracy(fc5, label)

        return to_proto(loss, acc)

    else:

        return to_proto(loss)

def write_net():

    #

    with open(train_proto, 'w') as f:

        f.write(str(create_net(train_list,batch_size=64)))

    #

    with open(val_proto, 'w') as f:

        f.write(str(create_net(val_list,batch_size=32, include_acc=True)))

if __name__ == '__main__':

    write_net()

即第一层由原来的Data类型，变成了ImageData类型，不需要LMDB文件和均值文件，但需要一个txt文件。

caffe的python接口学习（1）：生成配置文件的更多相关文章

caffe的python接口学习（1）生成配置文件
---恢复内容开始--- 看了denny的博客,写下自己觉得简短有用的部分想用caffe训练数据首先要学会编写配置文件: (即便是用别人训练好的模型也要进行微调的,所以此关不可跨越) 代码就不粘贴了 ...
caffe的python接口学习（4）：mnist实例---手写数字识别
深度学习的第一个实例一般都是mnist,只要这个例子完全弄懂了,其它的就是举一反三的事了.由于篇幅原因,本文不具体介绍配置文件里面每个参数的具体函义,如果想弄明白的,请参看我以前的博文: 数据层及参数 ...
caffe的python接口学习（7）：绘制loss和accuracy曲线
使用python接口来运行caffe程序,主要的原因是python非常容易可视化.所以不推荐大家在命令行下面运行python程序.如果非要在命令行下面运行,还不如直接用 c++算了. 推荐使用jupy ...
caffe的python接口学习（4）mnist实例手写数字识别
以下主要是摘抄denny博文的内容,更多内容大家去看原作者吧一数据准备准备训练集和测试集图片的列表清单; 二导入caffe库,设定文件路径 # -*- coding: utf-8 -*- im ...
caffe的python接口学习（2）：生成solver文件
caffe在训练的时候,需要一些参数设置,我们一般将这些参数设置在一个叫solver.prototxt的文件里面,如下: base_lr: 0.001 display: 782 gamma: 0.1 ...
caffe的python接口学习（2）生成solver文件
caffe在训练的时候,需要一些参数设置,我们一般将这些参数设置在一个叫solver.prototxt的文件里面有一些参数需要计算的,也不是乱设置. 假设我们有50000个训练样本,batch_si ...
caffe的python接口学习（5）：生成deploy文件
如果要把训练好的模型拿来测试新的图片,那必须得要一个deploy.prototxt文件,这个文件实际上和test.prototxt文件差不多,只是头尾不相同而也.deploy文件没有第一层数据输入层, ...
caffe的python接口学习（5）生成deploy文件
如果要把训练好的模型拿来测试新的图片,那必须得要一个deploy.prototxt文件,这个文件实际上和test.prototxt文件差不多,只是头尾不相同而也.deploy文件没有第一层数据输入层, ...
caffe的python接口学习（6）用训练好的模型caffemodel分类新图片
经过前面两篇博文的学习,我们已经训练好了一个caffemodel模型,并生成了一个deploy.prototxt文件,现在我们就利用这两个文件来对一个新的图片进行分类预测. 我们从mnist数据集的t ...

随机推荐

JSP中request getParameter和getAttribute不同(转载)
(1)request.getParameter()取得是通过容器的实现来取得通过类似post,get等方式传入的数据,,request.setAttribute()和getAttribute()只是在 ...
Tomcat：使用JMX监管Tomcat的几种方式
Tomcat使用JMX管理方式,在Tomcat的自带应用manager就是使用了JMX方式来管理Tomcat,以此完成Web应用的动态部署.启动.停止. 然而manager应用是一种本地使用JMX接口 ...
挖一挖C#中那些我们不常用的东西之系列（1）——ToDictionary,ToLookup
这个系列我们看看C#中有哪些我们知道,但是又不知道怎么用,又或者懒得去了解的东西,比如这篇我们要介绍的toDictionary 和ToLookup. 从图中我们看到有四个ToXXX的方法,其中ToAr ...
【JSP】JSP基础学习记录（四）—— Servlet
序: 众所周知JSP的基础也就是Servlet,如果单纯用Servlet类来响应用户的HTTP请求可以吗?答案是肯定的.JSP中的9个内置对象只是自动帮我们初始化的,没有他们一样可以实现web.只是工 ...
(1)编写一个接口ShapePara，要求：接口中的方法： int getArea()：获得图形的面积。int getCircumference()：获得图形的周长 (2)编写一个圆类Circle，要求：圆类Circle实现接口ShapePara。该类包含有成员变量： radius:public 修饰的double类型radius,表示圆的半径。 x：private修饰的double型变量x，
package com.hanqi.test; //创建接口 public interface ShapePara { //获取面积的方法 double getArea(); //获取周长的方法 do ...
Mysql常用的一些技巧命令
1.统计指定数据库下表的数量 mysql > use information_schema; mysql > SELECT count(TABLE_NAME) FROM informati ...
注意Android里TextView控件的一个小坑，用android:theme来设置样式时动态载入的layout会丢失该样式
注意Android里TextView控件的一个小坑,用android:theme来设置样式时动态载入的layout会丢失该样式这个坑,必须要注意呀, 比如在用ListView的时候,如果在List_ ...
mysql服务器配置
mysql的配置文件 /etc/mysql/my.cnf 发现如下配置 # Instead of skip-networking the default is now to listen only ...
解析json格式数据
实现目标读取文件中的json格式数据,一行为一条json格式数据.进行解析封装成实体类. 通过google的Gson对象解析json格式数据我现在解析的json格式数据为: {",&qu ...
JAVA中遇到 UTF-八序列的字节 1 无效
UTF-8 序列的字节 1 无效用dom4j操作xml文件, 出现了这个错误.原因是xml文件被创建的时候是ansi码格式. ( UTF-8 序列的字节 1 无效用dom4j操作xml文件, 出现 ...

caffe的python接口学习（1）：生成配置文件

caffe的python接口学习（1）：生成配置文件的更多相关文章

随机推荐

热门专题