Windows下mnist数据集caffemodel分类模型训练及测试

1. MNIST数据集介绍

MNIST是一个手写数字数据库，样本收集的是美国中学生手写样本，比较符合实际情况，大体上样本是这样的：

MNIST数据库有以下特性：

包含了60000个训练样本集和10000个测试样本集；
分4部分，分别是一个训练图片集，一个训练标签集，一个测试图片集，一个测试标签集，每个标签的值是0~9之间的数字；
原始图像归一化大小为28*28，以二进制形式保存

2. Windows+caffe框架下MNIST数据集caffemodel分类模型训练及测试

1. 下载mnist数据

MNIST官网下载链接：http://yann.lecun.com/exdb/mnist/

打开之后可以看到包含红字部分的4个下载包：

下载之后解压，我的caffe安装路径是 D:\Software\Caffe\caffe-master，所以训练数据和测试数据分别解压到了 D:\Software\Caffe\caffe-master\data\mnist\mnist_train_lmdb 和 D:\Software\Caffe\caffe-master\data\mnist\mnist_test_lmdb：

2. 将MNIST数据集转换为lmdb数据文件

caffe直接处理的数据分为两种格式： lmdb和leveldb，两者关系：

它们都是键/值对嵌入式数据库管理系统编程库
虽然lmdb的内存消耗是leveldb的1.1倍，但是lmdb的处理速度比leveldb快10%到15%，另外lmdb允许多种训练模型同时读取同一组数据集。
lmdb取代了leveldb成为了caffe默认的数据集生成格式。

在caffe-master目录下新建一个create_mnist.bat脚本文件，输入以下内容：

.\Build\x64\Debug\convert_mnist_data.exe .\data\mnist\mnist_train_lmdb\train-images.idx3-ubyte .\data\mnist\mnist_train_lmdb\train-labels.idx1-ubyte .\examples\mnist\mnist_train_lmdb

echo.

.\Build\x64\Debug\convert_mnist_data.exe .\data\mnist\mnist_test_lmdb\t10k-images.idx3-ubyte   .\data\mnist\mnist_test_lmdb\t10k-labels.idx1-ubyte .\examples\mnist\mnist_test_lmdb

pause

双击运行create_mnist.bat脚本文件，执行结果：

上述指令包括四部分内容，第一部分指定转换mnist数据集的.exe工具，第二部分传入mnist训练数据集的位置，第三部分传入mnist训练数据集的标签，第四部分指定lmdb文件的生成路径.

注意mnist_train_lmdb和mnist_test_lmdb两个文件夹是训练自动生成的，如果原文件下已经有这两个文件夹了，会报错。

执行完成之后会在指定的文件夹目录下生成mdb文件。

3. 计算数据库的均值文件

均值文件实际上就是所有训练样本计算出来的平均值，在目标识别领域使用caffe时，一般都有一个减去均值的操作，这样可以提高训练速度和识别精度。编译后的caffe会在Debug/Release下生成计算均值文件的工具——cmpute_image_mean.exe，caffe里均值文件的数据格式是binaryproto。

在caffe-master目录下，新建一个mnist_mean.bat脚本文件，输入如下内容：

.\Build\x64\Debug\compute_image_mean.exe .\examples\mnist\mnist_train_lmdb .\examples\mnist\mean.binaryproto

pause

双击运行，执行结果：

执行完成之后会在mnist目录下生成mean.binaryproto均值文件：

4. lenet训练参数设置

lenet-5是一个经典的CNN网络模型，最初是在1986年设计的，主要是为了识别手写字体和计算机打印字符，特别是在手写字体识别领域非常成功，曾经被广泛应用在美国银行系统的支票手写字体识别上。

设置lmdb文件路径

打开examples\mnist文件夹下的lenet_train_test.prototxt文件，两处source处输入lmdb文件夹的相对路径：

设置lenet训练参数

lenet训练参数设置是在examples\minst文件夹下的lenet_solver.prototxt文件内。基本设置有如下3个：

GPU or CPU： caffe中lenet的训练参数默认是使用GPU，这里修改为CPU；
最大迭代次数：最大迭代次数默认是10000，一般情况下最大迭代次数越大，训练的模型越准确，训练耗时也越长，这里max_iter的值10000不做修改。
caffemodel生成路径：训练完成之后会生成caffemodel分类模型，默认生成路径是在mnist根目录，这里修改为mnist目录下的CaffeModel文件夹内，snapshot_prefix: "examples/mnist/CaffeModel/lenet"；

3处修改的对应位置如下：

5. 执行lenet模型训练，生成caffemodel

在caffe-master目录下，新建一个train_mnist.bat脚本文件，输入以下内容：

.\Build\x64\Debug\caffe.exe train --solver=examples/mnist/lenet_solver.prototxt

pause

双击运行，开始训练：

使用CPU，最大迭代次数10000情况下，训练耗时约25min，训练完成之后会输出该模型的识别准确率和损失率:

准确率约为99%，训练完成后在设置的caffemodel生成路径 examples/minist/CaffeModel文件夹下生成caffemodel模型文件：

一共包含4个文件：

lenet_iter_10000.caffemodel 和 lenet_iter_5000.caffemodel：这两个文件是最终生成的caffemodel分类模型；
lenet_iter_10000.solverstate 和 lenet_iter_5000.solverstate ：这两个文件是记录当前训练状态信息文件。在跑训练模型的时候遇到断电等异常情况导致训练中断，再次训练的时候就不必浪费时间从头开始训练，只需要调用 .solverstate文件，从上次训练中断的位置处继续训练即可，具体使用方法略过。

6. 使用caffemodel测试一下mnist测试数据集的分类准确率

这里使用上一步训练生成的caffemodel模型测试一下对mnist测试数据集的分类准确率。

在caffe-master目录下新建一个test-mnist.bat的脚本文件，输入以下内容：

.\Build\x64\Debug\caffe.exe test --model=.\examples\mnist\lenet_train_test.prototxt -weights=.\examples\mnist\CaffeModel\lenet_iter_10000.caffemodel

pause

程序会根据lenet_train_test.prototxt文件里设置的测试数据集的路径自动加载到测试数据，双击运行，完成之后得到测试数据集的识别准确率，约为98.5%: