OpenCV+TensorFlow实现自定义手写图像识别
完整版请点击链接:https://mp.weixin.qq.com/s/5gHXGmLbtO7m3dOFrDUiHQ 或微信关注“大数据技术宅”
继用TensorFlow教你做手写字识别(准确率94.09%)文章中,笔者给出了CNN模型的训练以及给出了一些数字图像进行效果测试,这篇文章,笔者将给出自己手写数字图像,并且对图像进行简单处理,用上一篇文章中训练的网络进行手写数字的识别。下边跟着笔者的步伐实现属于自己的数字图像识别。
工具要求
工具及环境要求如下,如果大家在安装TensorFlow过程遇到问题,可以咨询笔者一起探讨。
Python 2.7.14
TensorFlow 1.5
pip 10.0.1
linux环境
openCV 2.4.13.6
C++
数字图像素材准备
笔者画了两个手写字,如图1所示,读者可以自行绘制自己的手写字图像。
图1 手绘数字图片
手绘数字图像预处理
由于笔者训练的CNN网络的输入图像是28*28像素的,所以需要对手绘数字图像进行简单处理,转换成28*28的灰度图像。图像处理的工具用的是openCV,C++代码如下:
1#include <opencv2/core/core.hpp>
2#include <opencv2/highgui/highgui.hpp>
3#include <opencv2/imgproc/imgproc.hpp>
4#include "cv.h"
5#include <string>
6#include <stdio.h>
7using namespace cv;
8using namespace std;
9
10cv::Mat org,dst,img,tmp;
11void on_mouse(int event,int x,int y,int flags,void *ustc)//event鼠标事件代号,x,y鼠标坐标,flags拖拽和键盘操作的代号
12{
13 static Point pre_pt = cv::Point(-1,-1);//初始坐标
14 static Point cur_pt = cv::Point(-1,-1);//实时坐标
15 char temp[16];
16 if (event == CV_EVENT_LBUTTONDOWN)//左键按下,读取初始坐标,并在图像上该点处划圆
17 {
18 org.copyTo(img);//将原始图片复制到img中
19 sprintf(temp,"(%d,%d)",x,y);
20 pre_pt = Point(x,y);
21 putText(img,temp,pre_pt,FONT_HERSHEY_SIMPLEX,0.5,Scalar(0,0,0,255),1,8);//在窗口上显示坐标
22 circle(img,pre_pt,2,Scalar(255,0,0,0),CV_FILLED,CV_AA,0);//划圆
23 imshow("img",img);
24 }
25 else if (event == CV_EVENT_MOUSEMOVE && !(flags & CV_EVENT_FLAG_LBUTTON))//左键没有按下的情况下鼠标移动的处理函数
26 {
27 img.copyTo(tmp);//将img复制到临时图像tmp上,用于显示实时坐标
28 sprintf(temp,"(%d,%d)",x,y);
29 cur_pt = Point(x,y);
30 putText(tmp,temp,cur_pt,FONT_HERSHEY_SIMPLEX,0.5,Scalar(0,0,0,255));//只是实时显示鼠标移动的坐标
31 imshow("img",tmp);
32 }
33 else if (event == CV_EVENT_MOUSEMOVE && (flags & CV_EVENT_FLAG_LBUTTON))//左键按下时,鼠标移动,则在图像上划矩形
34 {
35 img.copyTo(tmp);
36 sprintf(temp,"(%d,%d)",x,y);
37 cur_pt = Point(x,y);
38 putText(tmp,temp,cur_pt,FONT_HERSHEY_SIMPLEX,0.5,Scalar(0,0,0,255));
39 rectangle(tmp,pre_pt,cur_pt,Scalar(0,255,0,0),1,8,0);//在临时图像上实时显示鼠标拖动时形成的矩形
40 imshow("img",tmp);
41 }
42 else if (event == CV_EVENT_LBUTTONUP)//左键松开,将在图像上划矩形
43 {
44 org.copyTo(img);
45 sprintf(temp,"(%d,%d)",x,y);
46 cur_pt = Point(x,y);
47 putText(img,temp,cur_pt,FONT_HERSHEY_SIMPLEX,0.5,Scalar(0,0,0,255));
48 circle(img,pre_pt,2,Scalar(255,0,0,0),CV_FILLED,CV_AA,0);
49 rectangle(img,pre_pt,cur_pt,Scalar(0,255,0,0),1,8,0);//根据初始点和结束点,将矩形画到img上
50 imshow("img",img);
51 img.copyTo(tmp);
52 //截取矩形包围的图像,并保存到dst中
53 int width = abs(pre_pt.x - cur_pt.x);
54 int height = abs(pre_pt.y - cur_pt.y);
55 if (width == 0 || height == 0)
56 {
57 printf("width == 0 || height == 0");
58 return;
59 }
60 dst = org(Rect(min(cur_pt.x,pre_pt.x),min(cur_pt.y,pre_pt.y),width,height));
61 Mat dst02;
62 cv::resize(dst,dst02,Size(28,28));
63
64 imwrite("/home/openCV/mnist/temp.png",dst02);//注意将这里改为自己的处理结果存储地址
65 namedWindow("dst02");
66 imshow("dst02",dst02);
67 waitKey(0);
68 }
69}
70int main()
71{
72 org = imread("/home/openCV/mnist/ceshi8.jpg");//读取图片地址
73 org.copyTo(img);
74 org.copyTo(tmp);
75 namedWindow("img");//定义一个img窗口
76 setMouseCallback("img",on_mouse,0);//调用回调函数
77 imshow("img",img);
78 cv::waitKey(0);
79}
C++代码需要先编译,再运行,运行过程中如果遇到什么问题,欢迎读者跟笔者沟通,处理完之后图像如图2所示:
图2 预处理后手写图像
调用CNN网络对图像进行识别
用上一篇文章(用TensorFlow教你做手写字识别(准确率94.09%))部分,测试模型的代码,对处理过的手写图像进行识别,识别结果如图3所示:
图3 手写数字是被结果
通过笔者两篇手写数字识别文章的学习,相信动手尝试的读者已经对图像识别的流程有了简单的了解,在后续的图像识别系列文章中笔者会更加深入的介绍图像识别。图像识别的接下来两篇文章中笔者会用一篇讲解Faster R-CNN的原理,另一篇介绍Faster R-CNN的应用,并附上模型代码,预计要达到的效果如图4所示:
图4 图像识别效果
最后,笔者说一些题外话,本公众号运营到维护已经有近两个月时间,由于是笔者利用周末和业余时间所写,所以更新会比较缓慢,但笔者可以保证每周至少有一篇原创分享,并且保证本公众号不会存在任何商业行为,完全出于笔者爱好。希望想从事大数据及人工智能相关工作的读者与笔者互动交流,一块进步。
持续更新ing
OpenCV+TensorFlow实现自定义手写图像识别的更多相关文章
- TensorFlow 入门之手写识别(MNIST) softmax算法
TensorFlow 入门之手写识别(MNIST) softmax算法 MNIST flyu6 softmax回归 softmax回归算法 TensorFlow实现softmax softmax回归算 ...
- TensorFlow MNIST(手写识别 softmax)实例运行
TensorFlow MNIST(手写识别 softmax)实例运行 首先要有编译环境,并且已经正确的编译安装,关于环境配置参考:http://www.cnblogs.com/dyufei/p/802 ...
- Android+TensorFlow+CNN+MNIST 手写数字识别实现
Android+TensorFlow+CNN+MNIST 手写数字识别实现 SkySeraph 2018 Email:skyseraph00#163.com 更多精彩请直接访问SkySeraph个人站 ...
- 基于tensorflow的MNIST手写数字识别(二)--入门篇
http://www.jianshu.com/p/4195577585e6 基于tensorflow的MNIST手写字识别(一)--白话卷积神经网络模型 基于tensorflow的MNIST手写数字识 ...
- TensorFlow 入门之手写识别CNN 三
TensorFlow 入门之手写识别CNN 三 MNIST 卷积神经网络 Fly 多层卷积网络 多层卷积网络的基本理论 构建一个多层卷积网络 权值初始化 卷积和池化 第一层卷积 第二层卷积 密集层连接 ...
- TensorFlow 入门之手写识别(MNIST) softmax算法 二
TensorFlow 入门之手写识别(MNIST) softmax算法 二 MNIST Fly softmax回归 softmax回归算法 TensorFlow实现softmax softmax回归算 ...
- TensorFlow 入门之手写识别(MNIST) 数据处理 一
TensorFlow 入门之手写识别(MNIST) 数据处理 一 MNIST Fly softmax回归 准备数据 解压 与 重构 手写识别入门 MNIST手写数据集 图片以及标签的数据格式处理 准备 ...
- 基于TensorFlow的MNIST手写数字识别-初级
一:MNIST数据集 下载地址 MNIST是一个包含很多手写数字图片的数据集,一共4个二进制压缩文件 分别是test set images,test set labels,training se ...
- 基于tensorflow的MNIST手写识别
这个例子,是学习tensorflow的人员通常会用到的,也是基本的学习曲线中的一环.我也是! 这个例子很简单,这里,就是简单的说下,不同的tensorflow版本,相关的接口函数,可能会有不一样哟.在 ...
随机推荐
- BZOJ_4864_[BeiJing 2017 Wc]神秘物质_Splay
BZOJ4864_[BeiJing 2017 Wc]神秘物质_Splay Description 21ZZ 年,冬. 小诚退休以后, 不知为何重新燃起了对物理学的兴趣. 他从研究所借了些实验仪器,整天 ...
- PCB设计流程
一般PCB基本设计流程如下:前期准备->PCB结构设计->PCB布局->布线->布线优化和丝印->网络和DRC检查和结构检查->制版. 第一.前期准备. 这包括准备 ...
- JAVAEE——SpringMVC第一天:介绍、入门程序、架构讲解、SpringMVC整合MyBatis、参数绑定、SpringMVC和Struts2的区别
1. 学习计划 第一天 1.SpringMVC介绍 2.入门程序 3.SpringMVC架构讲解 a) 框架结构 b) 组件说明 4.SpringMVC整合MyBatis 5.参数绑定 a) Sp ...
- MIP技术进展月报第2期: 数据绑定,异步脚本加速
一. 功能更新 1. mip-bind 上线,实现复杂交互 MIP bind 双向绑定机制和组件上线,提供双向绑定的特性:能够允许页面实现数据驱动功能,开发者可以在任意场景修改数据,并驱动页面元素变动 ...
- 干货,分享一次完整的CentOS升级内核脚本。
一.安装常用包 yum install wget vim screen net-tools lrzsz -y wget -O /etc/yum.repos.d/epel.repo http://mir ...
- 自学java难吗?一个JAVA学习者应该具备的素质
无论是在校的学生也好,还是转行的也好,如今学JAVA开发的人越来越多,造成了如今新手越来越多,有人说前端饱和了,JAVA饱和了,JAVA才刚开始以一种好的势头发展就饱和了.我也是无语,一般说饱和的人, ...
- C#爬虫使用代理刷csdn文章浏览量
昨天写了一篇关于“c#批量抓取免费代理并验证有效性”的文章,接着昨天的目标继续完成吧,最终实现的目的就是刷新csdn文章的浏览量(实际上很简单,之前博客园的文章也是可以使用代理ip来刷的,后来不行了) ...
- 前端笔记之ES678&Webpack&Babel(上)初识ES678&Babel&let和const&解构&语法
一.ES版本简介和调试运行方法 1.1 ECMAScript简介 MDN手册:https://developer.mozilla.org/zh-CN/docs/Web/JavaScript JavaS ...
- DSAPI DS密法
DS密法是DYLIKE本人研发的一种针对文本字符串的高强度加密方法,本加密方法的优点是同源不同密,同一个源文本每次加密的结果都不同,长度也不同.密钥最大可达String类型的字符最大长度.缺点是解密时 ...
- 包装类及 LeetCode 每日一题
1.包装类与创建对象 Java 为8大数据类型都提供了相应的包装类,并提供属性和方法,更方便的操作基本数据类型.包装类位于java.lang包中. 对于这几种类型的基本数据,都有相似的方法实现基本数据 ...