caffe中LetNet-5卷积神经网络模型文件lenet.prototxt理解

caffe在 .\examples\mnist文件夹下有一个 lenet.prototxt文件，这个文件定义了一个广义的LetNet-5模型，对这个模型文件逐段分解一下。

name: "LeNet"   //网络的名称是LeNet

layer {                //定义一个网络层

  name: "data"   //定义该网络层的名称为 data

  type: "Input"   //定义网络层的类型是 输入层

  top: "data"      //定义网络层的输出名称为data

  //定义该网络层的训练参数

  input_param { 

  //如果同时读取过多张图片进行训练，训练耗时比较久

  //所以CNN中分组读入训练图片

  //shape中第一个参数定义每组中包含图片数量

  //第二个参数定义组数

  //第三和第四个参数定义图片大小

  //定义读取数据维度是： 64 1 28 28

  shape: { dim: 64 dim: 1 dim: 28 dim: 28 }

   }

}

//第一卷积层定义

layer {      //定义一个网络层

  name: "conv1"  //网络层的名称是conv1

  type: "Convolution"  //网络层的类型是 卷积层

  //模型结构图有两种常用画法，一种是从左到右，一种是从下到上

  //caffe中使用从下到上画法，所以“bottom”表示的是上一层（输入层）

  bottom: "data"  //网络层的输入层是 data层

  //同理，输出层在上，“top”表示输出

  top: "conv1"   //该层的输出层名称为conv1

  //param定义权重和偏置的学习率，学习率大，迭代速度快，但是容易找不到最优解

  //学习率小，迭代速度慢，耗时久

  //如果有两个lr_mult参数，第一个表示权重（卷积核）的学习率系数，第二个表示偏置的学习率系数

  //lr_mult定义的只是学习率系数，最终的值需要乘以solver.prototxt配置文件中配置的base_lr的值

  //一般偏置的学习率系数是权重学习率系数的2倍

  param {

    lr_mult: 1   //该层权重学习率的系数为1

  }

  param {

    lr_mult: 2   //该层偏置学习率的系数为2

  }

  //卷积操作的参数设置

  convolution_param {

    num_output: 20   //卷积输出特征图的数量为20

    kernel_size: 5      //卷积核的大小是5*5

    stride: 1               //卷积操作的步长是1，即卷积核逐个移动

    weight_filler {

      type: "xavier"   //卷积核参数采用xavier方法初始化

    }

    bias_filler {

      type: "constant"   //偏置初始值为0

    }

  }

} //卷积完成之后，数据的维度变成 64 20 24 24

//第一池化层定义

layer {

  name: "pool1"      //网络层的名称是pool1

  type: "Pooling"     //网络层的类型是池化层

  bottom: "conv1"  //网络层的输入时conv1(第一卷积层)

  top: "pool1"         //网络层的输出名称是 pool1

  //池化操作的参数设置

  pooling_param {

    pool: MAX        //最大值池化

    kernel_size: 2    //池化核尺寸 是2*2

    stride: 2            //池化步长是2

  }

}   //第一池化完成之后，数据的维度变成 64 20 12 12 

//第二卷积层定义

layer {

  name: "conv2"       //网络层的名称是conv2

  type: "Convolution"  //网络层的类型是卷积层

  bottom: "pool1"    //网络层的输入时 pool1（第一池化层）

  top: "conv2"          //网络层的输出名称是 conv2

  param {

    lr_mult: 1             //卷积核的学习率系数是1

  }

  param {

    lr_mult: 2             //偏置的学习率系数是2

  }

  //第二卷积层参数设置

  convolution_param {

    num_output: 50       //输出特征图的数量

    kernel_size: 5           //卷积核的尺寸是5*5

    stride: 1                   //卷积操作步长是1

    weight_filler {

      type: "xavier"          //卷积核参数采用xavier方法初始化

    }

    bias_filler {

      type: "constant"       //偏置初始值为0

    }

  }

}    //第二卷积操作完成之后，数据维度是 64 50 8 8 

//第二池化层

layer {

  name: "pool2"       //网络层的名称是 pool2

  type: "Pooling"      //网络层的类型是池化层

  bottom: "conv2"    //网络层的输入时 conv2（第二卷积层）

  top: "pool2"           //网络层的输出名称是 pool2

  pooling_param {

    pool: MAX            //池化方式是最大值池化

    kernel_size: 2        //池化核大小是2*2

    stride: 2                 //池化步长是2

  }

}        //第二池化层完成之后，数据维度是  64 50 4 4

//第一层全连接层定义

layer {

  name: "ip1"    //网络层的名称是ip1

  type: "InnerProduct"    //网络层的类型是 全连接层

  bottom: "pool2"          //网络层的输入时 pool2（第二池化层）

  top: "ip1"                     //网络层的输出名称是ip1

  param {

    lr_mult: 1                  //卷积核的学习率系数是1

  }

  param {

    lr_mult: 2					//偏置的学习率系数是2

  }

  //第一全连接层参数设置

  inner_product_param {

    num_output: 500     //输出向量维度，500个输出神经元

    weight_filler {

      type: "xavier"          //卷积核参数采用xavier方法初始化

    }

    bias_filler {

      type: "constant"	      //偏置初始值为0

    }

  }

}  //第一全连接层完成之后数据的维度是 1  500 1 1

//激活函数层的定义

layer {

  name: "relu1"     //网络层的名称是relu1

  type: "ReLU"      //网络层的类型是ReLU激活函数

  bottom: "ip1"     //网络层的输入时ip1（第一全连接层）

  top: "ip1"           //网络层的输出名称是 ip1，跟输入名称一样

}   //激活层完成之后，数据的维度是 1 500 1 1

//第二全连接层定义

//数据的分类判断在本层完成

layer {

  name: "ip2"      //网络层的名称是 ip2

  type: "InnerProduct"   //网络层的类型是全连接层

  bottom: "ip1"       //网络层的输入时 ip1（激活函数层）

  top: "ip2"      //网络层的输出名称是 ip2

  param {

    lr_mult: 1        //卷积核的学习率系数是1

  }

  param {

    lr_mult: 2	       //偏置的学习率系数是2

  }

  //第二全连接层参数设置

  inner_product_param {

    num_output: 10     //输出维度是10，分别是0~9的数字

    weight_filler {

      type: "xavier"       //卷积核参数采用xavier方法初始化

    }

    bias_filler {

      type: "constant"	  //偏置初始值为0

    }

  }

}    //第二全连接层完成之后，数据的维度是 1 10 1 1

//输出层定义

layer {

  name: "prob"    //网络的名称是 prob

  type: "Softmax"   //网络的类型是损失函数

  bottom: "ip2"     //网络的输入是 ip2（第二全连接层）

  top: "prob"       //网络的输出名称是 prob

}

lenet.prototxt模型可视化，可以作为对比：

caffe中LetNet-5卷积神经网络模型文件lenet.prototxt理解的更多相关文章

使用PyTorch简单实现卷积神经网络模型
这里我们会用 Python 实现三个简单的卷积神经网络模型:LeNet .AlexNet .VGGNet,首先我们需要了解三大基础数据集:MNIST 数据集.Cifar 数据集和 ImageNet 数 ...
CNN-1: LeNet-5 卷积神经网络模型
1.LeNet-5模型简介 LeNet-5 模型是 Yann LeCun 教授于 1998 年在论文 Gradient-based learning applied to document ...
手写数字识别 ----卷积神经网络模型官方案例注释（基于Tensorflow,Python）
# 手写数字识别 ----卷积神经网络模型 import os import tensorflow as tf #部分注释来源于 # http://www.cnblogs.com/rgvb178/p/ ...
利用Tensorflow实现卷积神经网络模型
首先看一下卷积神经网络模型,如下图: 卷积神经网络(CNN)由输入层.卷积层.激活函数.池化层.全连接层组成,即INPUT-CONV-RELU-POOL-FC池化层:为了减少运算量和数据维度而设置的一 ...
【TensorFlow/简单网络】MNIST数据集-softmax、全连接神经网络，卷积神经网络模型
初学tensorflow,参考了以下几篇博客: soft模型 tensorflow构建全连接神经网络 tensorflow构建卷积神经网络 tensorflow构建卷积神经网络 tensorflow构 ...
CNN-4: GoogLeNet 卷积神经网络模型
1.GoogLeNet 模型简介 GoogLeNet 是2014年Christian Szegedy提出的一种全新的深度学习结构,该模型获得了ImageNet挑战赛的冠军. 2.GoogLeNet 模 ...
CNN-2: AlexNet 卷积神经网络模型
1.AlexNet 模型简介由于受到计算机性能的影响,虽然LeNet在图像分类中取得了较好的成绩,但是并没有引起很多的关注. 知道2012年,Alex等人提出的AlexNet网络在ImageNet大 ...
CNN-3: VGGNet 卷积神经网络模型
1.VGGNet 模型简介 VGG Net由牛津大学的视觉几何组(Visual Geometry Group)和 Google DeepMind公司的研究员一起研发的的深度卷积神经网络,在 ILSVR ...
吴裕雄--天生自然python Google深度学习框架：经典卷积神经网络模型
import tensorflow as tf INPUT_NODE = 784 OUTPUT_NODE = 10 IMAGE_SIZE = 28 NUM_CHANNELS = 1 NUM_LABEL ...

随机推荐

英语发音规则---X字母
英语发音规则---X字母一.总结一句话总结: 1.x位于词尾或音节尾部,读/ks/? box /bɒks/ n.盒; 箱状物 fix /fɪks/ vt.固定 fox /fɒks/ n.狐; 狐狸 ...
AI安全初探——利用深度学习检测DNS隐蔽通道
AI安全初探——利用深度学习检测DNS隐蔽通道目录 AI安全初探——利用深度学习检测DNS隐蔽通道 1.DNS 隐蔽通道简介 2. 算法前的准备工作——数据采集 3. 利用深度学习进行DNS隐蔽通道 ...
FC 网络
通常情况下,SAN系统中服务器与存储介质通过一种特殊的网络相连,这种网络就是FC 网络. FC 网络是一种新发展的与传统的TCP/IP网络并列的一种高速网络.它有自己的地址分配和网络管理的体系. FC ...
13.ubuntu下Qt5无法使用中文的问题解决
1.首先安装fcitx-frontend-qt5 sudo apt-get install fcitx-frontend-qt5 这个应该是默认安装的,然后查看fcitx-frontend-qt5 的 ...
learn cmake
cmake简介在cmake出现之前,在linuxiax下,大型软件系统一般使用make来控制编译过程,而在Windows下可能是用vs下一个project来构建.一个复杂的系统本身依赖关系就很麻烦, ...
Pyhton学习——Day36
#异步IO——Asynchronous#异步效率最高,特点:全程无阻塞# 在说明synchronous IO和asynchronous IO的区别之前,需要先给出两者的定义.# Stevens给出的定 ...
Pyhton学习——Day34
# 任何语言都会发生多线程,会出现不同步的问题,同步锁.死锁.递归锁# 异步: 多任务, 多个任务之间执行没有先后顺序,可以同时运行,执行的先后顺序不会有什么影响,存在的多条运行主线# 同步: 多任务 ...
装饰器阶段性练习(题目)[转载http://www.cnblogs.com/linhaifeng/p/7278389.html]
# 一:编写函数,(函数执行的时间是随机的)# 二:编写装饰器,为函数加上统计时间的功能# 三:编写装饰器,为函数加上认证的功能## 四:编写装饰器,为多个函数加上认证的功能(用户的账号密码来源于文件 ...
node——将数据写入data.json防覆盖
前续 1.读取data.json文件内容 2.判断是否是第一次读取data.json(第一次读取则data.json是没有的) 3.将data.json数据转为数组list 4.将写入数据加入数组li ...
ES modules
注意:这篇文章讲的是正经的es module规范及浏览器的实现!webpack项目中es module会被parse成commonjs,和这个没大关系! 总结: ES模块加载的主要过程: 构造 —— ...

caffe中LetNet-5卷积神经网络模型文件lenet.prototxt理解

caffe中LetNet-5卷积神经网络模型文件lenet.prototxt理解的更多相关文章

随机推荐

热门专题