深度学习之Matlab 转C++在iOS上測试CNN手型识别
1 前言
在上一篇Blog。我介绍了在iOS上执行CNN的一些方法。
可是,一般来说。我们须要一个性能强劲的机器来跑CNN,我们仅仅只是须要将得到的结果用于移动端。
之前在Matlab使用UFLDL的代码改动后跑了手型识别的3层CNN,这里我们就考虑将Matlab转C之后移植到xcode中。
Step 1:Matlab 转c
首先要保证代码能够跑。能够执行,比方我这边。例如以下測试cnn识别手型:
>> parameters = load('./opt_parameters/opttheta_8epoches_cnn.mat');
cnnPredict(imread('./data/test_five1 (1).bmp'),parameters.opttheta)
ans =
5
大家能够看到。我识别出来是5个手指。OK,CNN没有问题。如今就是要将cnnPredict函数转c,这里大家能够看到这个函数包括了输入数据和已训练的參数。
function labels = cnnPredict(images,opttheta)
基本方式是使用Matlab自带的工具:coder。
在Command窗体输入coder:
新建一个项目:
这里我已经导入了我要转的文件cnnPredict.m,里面有两个输入变量,我须要定义其变量类型,这里我使用autodefine types。就是写一个脚本执行这个函数。即可。
也就是我一開始贴的代码,识别出来后是这样:
这里大家能够看到我这边CNN的參数并非非常多,也就是19万个參数而已。
接下来就是build了。这里选择c/c++ static library。而且仅仅输出c code:
build结果例如以下:
有可能你会build失败。这个时候可能是数据类型问题,能够依据详细情况进行改动到成功为止。
生成的code在目录的codegen目录中:
Step 2:将.Mat參数导出为.txt格式
在训练的时候,我们的cnn參数是存储在.mat中,因此,为了能在xcode中使用,我们须要将參数导出,这里我选择导出为.txt格式。
导出方法非常easy,一条代码;
>> save('opttheta.txt','opttheta','-ASCII'); %将opt theta參数保存为opttheta.txt
Step 3: 新建iOSproject。导入cnnPredict代码
这一步非常easy,把整个目录拉进来就OK了。
注意cnnPredict.h代码。我们要用的也就是这里面的函数了:
/*
* File: cnnPredict.h
*
* MATLAB Coder version : 2.7
* C/C++ source code generated on : 16-Jul-2015 16:22:01
*/
#ifndef __CNNPREDICT_H__
#define __CNNPREDICT_H__
/* Include Files */
#include <math.h>
#include <stddef.h>
#include <stdlib.h>
#include <string.h>
#include "rt_nonfinite.h"
#include "rtwtypes.h"
#include "cnnPredict_types.h"
/* Function Declarations */
extern double cnnPredict(const double images[9216], const double opttheta[195245]);
#endif
/*
* File trailer for cnnPredict.h
*
* [EOF]
*/
注意的是导入执行里面有个interface目录会导致执行失败。应删除之,不会影响其它。
Step 4 在Xcode中导入參数
这一步就是读取txt文件里的数据并转存为double的数组。直接贴代码:
NSString *filePath = [[NSBundle mainBundle] pathForResource:@"opttheta" ofType:@"txt"];
NSString *testString = [NSString stringWithContentsOfFile:filePath encoding:NSUTF8StringEncoding error:nil];
NSMutableArray *thetaString = (NSMutableArray *)[testString componentsSeparatedByString:@"\n"];
[thetaString removeLastObject];
NSLog(@"Theta1 count:%lu",(unsigned long)thetaString.count);
for (int i = 0; i < thetaString.count; i++) {
NSString *data = [thetaString objectAtIndex:i];
theta[i] = [data doubleValue];
}
从代码中能够看到。就是用’\n’来切割数据,道理非常easy。
Step 5 将图片转换为double数组
为了使用函数,我们必须将图片转换为数组。
我们这里显然是使用灰度图片,转换的代码例如以下:
UIImage *image = [UIImage imageNamed:@"one.bmp"];
CGImageRef imageRef = [image CGImage];
CGDataProviderRef provider = CGImageGetDataProvider(imageRef);
NSData *data = (id)CFBridgingRelease(CGDataProviderCopyData(provider));
NSLog(@"image:%lu",(unsigned long)data.length);
const uint8_t *bytes = [data bytes];
这里就转换为uint8的数组了,接下来我这边依据须要对图片的灰度矩阵须要进行转置:
double newBytes[9216];
for (int y = 0; y < 96 ; y++) {
for (int x = 0; x < 96; x++) {
newBytes[x*96 + y] = bytes[y*96 + x];
}
}
Step 6: 执行cnn
有了上面的处理。这一步直接执行cnnPredict
double result = cnnPredict(newBytes, theta);
NSLog(@"result:%f",result);
直接就输出结果了:
大家看到了吗?识别出的结果为1。就是大拇指的意思。
事实上看到这里,我自己都是有点激动的。特别爽是不是,iOS上执行的CNN直接识别手势。尽管这边的图片是黑白的比較简单一点。
小结
本文总结了怎样将CNN的MATLAB代码转换为C++代码然后在iOS上直接执行的方法。
希望对同道中人有启示!
深度学习之Matlab 转C++在iOS上測试CNN手型识别的更多相关文章
- iOS单元測试:Specta + Expecta + OCMock + OHHTTPStubs + KIF
框架选择 參考这篇选型文章,http://zixun.github.io/blog/2015/04/11/iosdan-yuan-ce-shi-xi-lie-dan-yuan-ce-shi-kuang ...
- iOS 单元測试之XCTest具体解释(一)
原创blog,转载请注明出处 blog.csdn.net/hello_hwc 欢迎关注我的iOS-SDK具体解释专栏 http://blog.csdn.net/column/details/huang ...
- ios单元測试之GHUnit
1.相同创建一个測试的project, 2.通过cocoaPod来下载GHUnit框架,或者到github上下载.由于这个框架是开源的第三方框架. 同一时候加入QuartCore.framework( ...
- 【深度学习篇】--神经网络中的池化层和CNN架构模型
一.前述 本文讲述池化层和经典神经网络中的架构模型. 二.池化Pooling 1.目标 降采样subsample,shrink(浓缩),减少计算负荷,减少内存使用,参数数量减少(也可防止过拟合)减少输 ...
- 吴恩达深度学习笔记(deeplearning.ai)之卷积神经网络(CNN)(上)
作者:szx_spark 1. Padding 在卷积操作中,过滤器(又称核)的大小通常为奇数,如3x3,5x5.这样的好处有两点: 在特征图(二维卷积)中就会存在一个中心像素点.有一个中心像素点会十 ...
- 深度学习框架caffe在macOS Heigh Sierra上安装过程实录
第一步.安装依赖库 brew install -vd snappy leveldb gflags glog szip lmdb brew tap homebrew/science brew insta ...
- github上热门深度学习项目
github上热门深度学习项目 项目名 Stars 描述 TensorFlow 29622 使用数据流图进行可扩展机器学习的计算. Caffe 11799 Caffe:深度学习的快速开放框架. [Ne ...
- 【腾讯Bugly干货分享】深度学习在OCR中的应用
本文来自于腾讯bugly开发者社区,未经作者同意,请勿转载,原文地址:http://dev.qq.com/topic/5809bb47cc5e52161640c5c8 Dev Club 是一个交流移动 ...
- 【转】贾扬清:希望Caffe成为深度学习领域的Hadoop
[转:http://www.csdn.net/article/2015-07-07/2825150] 在深度学习(Deep Learning)的热潮下,Caffe作为一个高效.实用的深度学习框架受到了 ...
随机推荐
- datatable无法设置横向滚动条(设置无效)
datatable设置横向滚动条无效 js如下: 页面如下: 设置 scrollx 属性为true时,还需在 table 添加 style="white-space: nowrap; &qu ...
- redis源码解析之内存管理
zmalloc.h的内容如下: void *zmalloc(size_t size); void *zcalloc(size_t size); void *zrealloc(void *ptr, si ...
- Android测试之Keycode
问题: 昨天做测试Case,发现一个网游APK运行界面,uiautomator无法捕捉获取. 因而输入的时候只得运用(dut.onclick(int a, int y))坐标点击的方法来输入用户名和密 ...
- thinkphp去重统计数据sql
DISTINCT 方法用于返回唯一不同的值 官方文档给出的示例: $Model->distinct(true)->field('userName')->select(); 解析的SQ ...
- zk选举过程
1. 服务器启动时期的Leader选举 若进行Leader选举,则至少需要两台机器,这里选取3台机器组成的服务器集群为例.在集群初始化阶段,当有一台服务器Server1启动时,其单独无法进行和完成Le ...
- DB2数据库性能调整和优化(第2版)
<DB2数据库性能调整和优化(第2版)> 基本信息 作者: 牛新庄 出版社:清华大学出版社 ISBN:9787302325260 上架时间:2013-7-3 出版日期:2013 年7月 开 ...
- The Apache Tomcat Native library which allows optimal performance in production environments was not found on the java.library.path:
今天下载Windows安装版的tomcat5.5,安装完以后启动时候出现: The Apache Tomcat Native library which allows optimal performa ...
- java jar包 log4j不能输出解决方法
今天运行一个jar包,jar包中使用了springContext进行加载bean和log4j配置,但是发现不能正常输入日志. 代码中增加 Xxx.class.getResource("/&q ...
- Wishbone接口Altera JTAG UART
某些时候,我们在使用Altera FPGA的时候,尤其是涉及SoC系统的时候,通常需要一个串口与PC交互.使用Altera的USB-Blaster免去了外接一个串口.我们可以使用下面所述的IP核通过U ...
- 安装pip源
国内源地址: 豆瓣(douban) http://pypi.douban.com/simple/ 阿里云 http://mirrors.aliyun.com/pypi/simple/ 中国科技大学 h ...