tiny-cnn开源库的使用(MNIST)

tiny-cnn是一个基于CNN的开源库，它的License是BSD 3-Clause。作者也一直在维护更新，对进一步掌握CNN非常有帮助，因此以下介绍下tiny-cnn在windows7 64bit vs2013的编译及使用。

1. 从https://github.com/nyanp/tiny-cnn下载源代码：

$ git clone https://github.com/nyanp/tiny-cnn.git 版本为77d80a8，更新日期2016.01.22

2. 源文件里已经包括了vs2013project，vc/tiny-cnn.sln，默认是win32的，examples/main.cpp须要OpenCV的支持。这里新建一个x64的控制台projecttiny-cnn。

3. 仿照源project，将对应.h文件加入到新控制台project中。新加一个test_tiny-cnn.cpp文件；

4. 将examples/mnist中test.cpp和train.cpp文件里的代码拷贝到test_tiny-cnn.cpp文件里；

#include <iostream>

#include <string>

#include <vector>

#include <algorithm>

#include <tiny_cnn/tiny_cnn.h>

#include <opencv2/opencv.hpp>

using namespace tiny_cnn;

using namespace tiny_cnn::activation;

// rescale output to 0-100

template <typename Activation>

double rescale(double x)

{

	Activation a;

	return 100.0 * (x - a.scale().first) / (a.scale().second - a.scale().first);

}

void construct_net(network<mse, adagrad>& nn);

void train_lenet(std::string data_dir_path);

// convert tiny_cnn::image to cv::Mat and resize

cv::Mat image2mat(image<>& img);

void convert_image(const std::string& imagefilename, double minv, double maxv, int w, int h, vec_t& data);

void recognize(const std::string& dictionary, const std::string& filename, int target);

int main()

{

	//train

	std::string data_path = "D:/Download/MNIST";

	train_lenet(data_path);

	//test

	std::string model_path = "D:/Download/MNIST/LeNet-weights";

	std::string image_path = "D:/Download/MNIST/";

	int target[10] = { 0, 1, 2, 3, 4, 5, 6, 7, 8, 9 };

	for (int i = 0; i < 10; i++) {

		char ch[15];

		sprintf(ch, "%d", i);

		std::string str;

		str = std::string(ch);

		str += ".png";

		str = image_path + str;

		recognize(model_path, str, target[i]);

	}

	std::cout << "ok!" << std::endl;

	return 0;

}

void train_lenet(std::string data_dir_path) {

	// specify loss-function and learning strategy

	network<mse, adagrad> nn;

	construct_net(nn);

	std::cout << "load models..." << std::endl;

	// load MNIST dataset

	std::vector<label_t> train_labels, test_labels;

	std::vector<vec_t> train_images, test_images;

	parse_mnist_labels(data_dir_path + "/train-labels.idx1-ubyte",

		&train_labels);

	parse_mnist_images(data_dir_path + "/train-images.idx3-ubyte",

		&train_images, -1.0, 1.0, 2, 2);

	parse_mnist_labels(data_dir_path + "/t10k-labels.idx1-ubyte",

		&test_labels);

	parse_mnist_images(data_dir_path + "/t10k-images.idx3-ubyte",

		&test_images, -1.0, 1.0, 2, 2);

	std::cout << "start training" << std::endl;

	progress_display disp(train_images.size());

	timer t;

	int minibatch_size = 10;

	int num_epochs = 30;

	nn.optimizer().alpha *= std::sqrt(minibatch_size);

	// create callback

	auto on_enumerate_epoch = [&](){

		std::cout << t.elapsed() << "s elapsed." << std::endl;

		tiny_cnn::result res = nn.test(test_images, test_labels);

		std::cout << res.num_success << "/" << res.num_total << std::endl;

		disp.restart(train_images.size());

		t.restart();

	};

	auto on_enumerate_minibatch = [&](){

		disp += minibatch_size;

	};

	// training

	nn.train(train_images, train_labels, minibatch_size, num_epochs,

		on_enumerate_minibatch, on_enumerate_epoch);

	std::cout << "end training." << std::endl;

	// test and show results

	nn.test(test_images, test_labels).print_detail(std::cout);

	// save networks

	std::ofstream ofs("D:/Download/MNIST/LeNet-weights");

	ofs << nn;

}

void construct_net(network<mse, adagrad>& nn) {

	// connection table [Y.Lecun, 1998 Table.1]

#define O true

#define X false

	static const bool tbl[] = {

		O, X, X, X, O, O, O, X, X, O, O, O, O, X, O, O,

		O, O, X, X, X, O, O, O, X, X, O, O, O, O, X, O,

		O, O, O, X, X, X, O, O, O, X, X, O, X, O, O, O,

		X, O, O, O, X, X, O, O, O, O, X, X, O, X, O, O,

		X, X, O, O, O, X, X, O, O, O, O, X, O, O, X, O,

		X, X, X, O, O, O, X, X, O, O, O, O, X, O, O, O

	};

#undef O

#undef X

	// construct nets

	nn << convolutional_layer<tan_h>(32, 32, 5, 1, 6)  // C1, 1@32x32-in, 6@28x28-out

		<< average_pooling_layer<tan_h>(28, 28, 6, 2)   // S2, 6@28x28-in, 6@14x14-out

		<< convolutional_layer<tan_h>(14, 14, 5, 6, 16,

		connection_table(tbl, 6, 16))              // C3, 6@14x14-in, 16@10x10-in

		<< average_pooling_layer<tan_h>(10, 10, 16, 2)  // S4, 16@10x10-in, 16@5x5-out

		<< convolutional_layer<tan_h>(5, 5, 5, 16, 120) // C5, 16@5x5-in, 120@1x1-out

		<< fully_connected_layer<tan_h>(120, 10);       // F6, 120-in, 10-out

}

void recognize(const std::string& dictionary, const std::string& filename, int target) {

	network<mse, adagrad> nn;

	construct_net(nn);

	// load nets

	std::ifstream ifs(dictionary.c_str());

	ifs >> nn;

	// convert imagefile to vec_t

	vec_t data;

	convert_image(filename, -1.0, 1.0, 32, 32, data);

	// recognize

	auto res = nn.predict(data);

	std::vector<std::pair<double, int> > scores;

	// sort & print top-3

	for (int i = 0; i < 10; i++)

		scores.emplace_back(rescale<tan_h>(res[i]), i);

	std::sort(scores.begin(), scores.end(), std::greater<std::pair<double, int>>());

	for (int i = 0; i < 3; i++)

		std::cout << scores[i].second << "," << scores[i].first << std::endl;

	std::cout << "the actual digit is: " << scores[0].second << ", correct digit is: "<<target<<std::endl;

	// visualize outputs of each layer

	//for (size_t i = 0; i < nn.depth(); i++) {

	//	auto out_img = nn[i]->output_to_image();

	//	cv::imshow("layer:" + std::to_string(i), image2mat(out_img));

	//}

	//// visualize filter shape of first convolutional layer

	//auto weight = nn.at<convolutional_layer<tan_h>>(0).weight_to_image();

	//cv::imshow("weights:", image2mat(weight));

	//cv::waitKey(0);

}

// convert tiny_cnn::image to cv::Mat and resize

cv::Mat image2mat(image<>& img) {

	cv::Mat ori(img.height(), img.width(), CV_8U, &img.at(0, 0));

	cv::Mat resized;

	cv::resize(ori, resized, cv::Size(), 3, 3, cv::INTER_AREA);

	return resized;

}

void convert_image(const std::string& imagefilename,

	double minv,

	double maxv,

	int w,

	int h,

	vec_t& data) {

	auto img = cv::imread(imagefilename, cv::IMREAD_GRAYSCALE);

	if (img.data == nullptr) return; // cannot open, or it's not an image

	cv::Mat_<uint8_t> resized;

	cv::resize(img, resized, cv::Size(w, h));

	// mnist dataset is "white on black", so negate required

	std::transform(resized.begin(), resized.end(), std::back_inserter(data),

		[=](uint8_t c) { return (255 - c) * (maxv - minv) / 255.0 + minv; });

}

5. 编译时会提示几个错误，解决方法是：

(1)、error C4996。解决方法：将宏_SCL_SECURE_NO_WARNINGS加入到属性的预处理器定义中；

(2)、调用for_函数时，error C2668，对重载函数的调用不明教，解决方法：将for_中的第三个參数强制转化为size_t类型；

6. 执行程序，train时，执行结果例如以下图所看到的：

watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQv/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA==/dissolve/70/gravity/Center" alt="" />

7. 对生成的model进行測试，通过绘图工具，每一个数字生成一张图像，共10幅，例如以下图：

通过导入train时生成的model。对这10张图像进行识别，识别结果例如以下图，当中6和9被误识为5和1：

GitHub：https://github.com/fengbingchun/NN

tiny-cnn开源库的使用(MNIST)的更多相关文章

深度学习开源库tiny-dnn的使用(MNIST)
tiny-dnn是一个基于DNN的深度学习开源库,它的License是BSD 3-Clause.之前名字是tiny-cnn是基于CNN的,tiny-dnn与tiny-cnn相关又增加了些新层.此开源库 ...
站在巨人的肩膀上，C++开源库大全
程序员要站在巨人的肩膀上,C++拥有丰富的开源库,这里包括:标准库.Web应用框架.人工智能.数据库.图片处理.机器学习.日志.代码分析等. 标准库 C++ Standard Library:是一系列 ...
GitHub C 和 C++ 开源库的清单（含示例代码）
内容包括:标准库.Web应用框架.人工智能.数据库.图片处理.机器学习.日志.代码分析等. 标准库 C++标准库,包括了STL容器,算法和函数等. C++ Standard Library:是一系列类 ...
C++开源库大全（转）
程序员要站在巨人的肩膀上,C++拥有丰富的开源库,这里包括:标准库.Web应用框架.人工智能.数据库.图片处理.机器学习.日志.代码分析等. 标准库 C++ Standard Library:是一系列 ...
C++开源库大全
标准库 C++ Standard Library:是一系列类和函数的集合,使用核心语言编写,也是C++ISO自身标准的一部分. Standard Template Library:标准模板库 ...
【踩坑速记】开源日历控件，顺便全面解析开源库打包发布到Bintray/Jcenter全过程（新），让开源更简单~
一.写在前面自使用android studio开始,就被它独特的依赖方式:compile 'com.android.support:appcompat-v7:25.0.1'所深深吸引,自从有了它,麻 ...
Java下好用的开源库推荐
作者:Jack47 转载请保留作者和原文出处欢迎关注我的微信公众账号程序员杰克,两边的文章会同步,也可以添加我的RSS订阅源. 本文想介绍下自己在Java下做开发使用到的一些开源的优秀编程库,会不定 ...
第三方开源库和jar包的区别
jar包和第三方开源库的根本区别在于,开源库的功能比jar包功能更强大,通过引入库项目可以访问java文件以及该开源库项目下的资源文件,例如图片,layout等文件 jar包中只能放class文件引 ...
【转】用JitPack发布开源库时附加文档和源码
来自:http://www.gcssloop.com/course/jitpack-sources-javadoc 用JitPack发布开源库时附加文档和源码很早之前写过一篇用JitPack发布An ...

随机推荐

V-rep学习笔记：Reflexxes Motion Library 2
VREP中的simRMLMoveToPosition函数可以将静态物体按照设定的运动规律移动到指定的目标位置/姿态.If your object is dynamically enabled, it ...
5、探秘JDK5新并发库之原子性操作类
java.util.concurrent.atomic包里提供了 AtomicBoolean 可以用原子方式更新的 boolean 值. AtomicInteger 可以用原子方式更新的 int 值. ...
4、线程范围内的数据共享之ThreadLocal
/** * 线程范围类的数据共享 * 核心:ThreadLocal类 * 实际场景: * Hibernate的getCurrentSession方法,就是从线程范围内获取存在的session,如果不存 ...
asp:ObjectDataSource+asp:GridView 实现真分页
<asp:GridView ID="GridViewCacheManager" DataSourceID="OdsCacheManager" runat= ...
CentOS下nodejs最简单的安装方法
1. 下载编译好的文件我的系统是centos7,进入要存放下载资源的目录,个人建议存放在/usr/local/src/目录下.然后执行安装命令: wget http://nodejs.org/dis ...
ios中二维码的用法
网上的例子 zbar 下载地址 http://pan.baidu.com/share/link?shareid=2652605686&uk=9237761871.新建一个工程A:view-ba ...
saltstack 基础入门文档
saltstack 和 Puppet Chef 一样可以让你同时在多台服务器上执行命令也包括安装和配置软件.Salt 有两个主要的功能:配置管理和远程执行.这里讲述了saltstack的基本使用方法. ...
windows下如何生成gitlab ssh公钥
1.查看是否已经有了ssh密钥:cd ~/.ssh如果没有密钥则不会有此文件夹,有则备份删除2.生存密钥: $ ssh-keygen -t rsa -C “你的邮箱”按3个回车,密码为空. Your ...
PowerDesigner使用：[3]创建索引
PowerDesigner是一款功能非常强大的建模工具软件,足以与Rose比肩,同样是当今最著名的建模软件之一.Rose是专攻UML对象模型的建模工具,之后才向数据库建模发展,而PowerDesign ...
Maven运行Selenium报错org/w3c/dom/ElementTraversal
项目使用maven 构建,并且使用集成测试(integration-test). 在命令行中运行mvn clean deploy tomcat:undeploy时,报错: java.lang.NoCl ...

tiny-cnn开源库的使用(MNIST)

tiny-cnn开源库的使用(MNIST)的更多相关文章

随机推荐

热门专题