opencv实现KNN手写数字的识别

　　人工智能是当下很热门的话题，手写识别是一个典型的应用。为了进一步了解这个领域，我阅读了大量的论文，并借助opencv完成了对28x28的数字图片（预处理后的二值图像）的识别任务。

　　预处理一张图片：

　　首先采用opencv读取图片的构造函数读取灰度的图片，再采用大津法求出图片的二值化的阈值，并且将图片二值化。

 int otsu(const IplImage* src_image) {

     double sum = 0.0;

     double w0 = 0.0;

     double w1 = 0.0;

     double u0_temp = 0.0;

     double u1_temp = 0.0;

     double u0 = 0.0;

     double u1 = 0.0;

     double delta_temp = 0.0;

     double delta_max = 0.0;

     int pixel_count[] = {  };

     float pixel_pro[] = {  };

     int threshold = ;

     uchar* data = (uchar*)src_image->imageData;

     for (int i = ; i < src_image->height; i++) {

         for (int j = ; j < src_image->width; j++) {

             pixel_count[(int)data[i * src_image->width + j]]++;

             sum += (int)data[i * src_image->width + j];

         }

     }

     for (int i = ; i < ; i++) {

         pixel_pro[i] = (float)pixel_count[i] / (src_image->height * src_image->width);

     }

     for (int i = ; i < ; i++) {

         w0 = w1 = u0_temp = u1_temp = u0 = u1 = delta_temp = ;

         for (int j = ; j < ; j++) {

             if (j <= i) {

                 w0 += pixel_pro[j];

                 u0_temp += j * pixel_pro[j];

             }

             else {

                 w1 += pixel_pro[j];

                 u1_temp += j * pixel_pro[j];

             }

         }

         u0 = u0_temp / w0;

         u1 = u1_temp / w1;

         delta_temp = (float)(w0 *w1* pow((u0 - u1), ));

         if (delta_temp > delta_max) {

             delta_max = delta_temp;

             threshold = i;

         }

     }

     return threshold;

 }

大津法

 void imageBinarization(IplImage* src_image) {

     IplImage* binImg = cvCreateImage(cvGetSize(src_image), src_image->depth, src_image->nChannels);

     CvScalar s;

     int ave = ;

     int binThreshold = otsu(src_image);

     for (int i = ; i < src_image->height; i++) {

         for (int j = ; j < src_image->width; j++) {

             s = cvGet2D(src_image, i, j);

             ave = (s.val[] + s.val[] + s.val[]) / ;

             if (ave < binThreshold) {

                 s.val[] = s.val[] = s.val[] = 0xff;

                 cvSet2D(src_image, i, j, s);

             }

             else {

                 s.val[] = s.val[] = s.val[] = 0x00;

                 cvSet2D(src_image, i, j, s);

             }

         }

     }

     cvCopy(src_image, binImg);

     cvSaveImage(bined, binImg);

     //cvShowImage("binarization", binImg);

     //waitKey(0);

 }

二值化

　　由于是只进行简单的识别模拟，因此没有做像素断点的处理。获取minst提供的数据集，提取每个图片的hog特征，参数如下：

 HOGDescriptor *hog = new HOGDescriptor(

             cvSize(ImgWidht, ImgHeight), cvSize(, ), cvSize(, ), cvSize(, ), );

　　（9个方向换成18个可能会取得更准确的结果，这取决于对图片本身的复杂程度的分析

　　之后即可训练knn分类器，进行分类了。

 void knnTrain() {

 #ifdef SAVETRAINED

     //knn training;

     samples.clear();

     dat_mat = Mat::zeros( * nImgNum, , CV_32FC1);

     res_mat = Mat::zeros( * nImgNum, , CV_32FC1);

     for (int i = ; i != ; i++) {

         getFile(dirNames[i], i);

     }

     preTrain();

     cout << "------ Training finished. -----" << endl << endl;

     knn.train(dat_mat, res_mat, Mat(), false, );

 #ifdef SAVEASXML

     knn.save("./trained/knnTrained.xml");

 #endif

 #else

     knn.load("./trained/knnTrained.xml");

 #endif

     //knn test

     cout << endl << "--- KNN test mode : ---" << endl;

     int tCnt = ;

     int tAc = ;

     selfknnTest(tCnt, tAc);

     cout << endl << endl << "Total number of test samples : " << tCnt << endl;

     cout << "Accuracy : " << float(float(tAc) / float(tCnt)) *  << "%" << endl;

 }

train

　训练结果如下，准确率还是很令人满意的。

opencv实现KNN手写数字的识别的更多相关文章

OpenCV+TensorFlow图片手写数字识别(附源码)
初次接触TensorFlow,而手写数字训练识别是其最基本的入门教程,网上关于训练的教程很多,但是模型的测试大多都是官方提供的一些素材,能不能自己随便写一串数字让机器识别出来呢?纸上得来终觉浅,带着这 ...
手把手教你使用LabVIEW OpenCV DNN实现手写数字识别（含源码）
@ 目录前言一.OpenCV DNN模块 1.OpenCV DNN简介 2.LabVIEW中DNN模块函数二.TensorFlow pb文件的生成和调用 1.TensorFlow2 Keras模 ...
机器学习（二）-kNN手写数字识别
一.kNN算法是机器学习的入门算法,其中不涉及训练,主要思想是计算待测点和参照点的距离,选取距离较近的参照点的类别作为待测点的的类别. 1,距离可以是欧式距离,夹角余弦距离等等. 2,k值不能选择太大 ...
kaggle 实战（1）: PCA + KNN 手写数字识别
文章目录加载package read data PCA 降维探索选择50维度, 拆分数据为训练集,测试机 KNN PCA降维和K值筛选分析k & 维度 vs 精度预测生成提交文件本 ...
用Keras搭建神经网络简单模版（三）—— CNN 卷积神经网络（手写数字图片识别）
# -*- coding: utf-8 -*- import numpy as np np.random.seed(1337) #for reproducibility再现性 from keras.d ...
10，knn手写数字识别
# 导包 import numpy as np import matplotlib.pyplot as plt from sklearn.neighbors import KNeighborsClas ...
KNN手写数字识别
import numpy as np import matplotlib .pyplot as plt from sklearn.neighbors import KNeighborsClassifi ...
caffe+opencv3.3dnn模块完成手写数字图片识别
最近由于项目需要用到caffe,学习了下caffe的用法,在使用过程中也是遇到了些问题,通过上网搜索和问老师的方法解决了,在此记录下过程,方便以后查看,也希望能为和我一样的新手们提供帮助. 顺带附上老 ...
用tensorflow求手写数字的识别准确率（简单版）
import tensorflow as tf from tensorflow.examples.tutorials.mnist import input_data #载入数据集 mnist = in ...

随机推荐

Leetcode#172 Fractorial Trailing Zero
原题地址 n!含有多少个因子10,则结尾有多少个0 10=2*5,而2的个数肯定比5多,所以n!含有多少个因子5,则结尾有多少个0 如何计算n!有多少个因子5呢? 比如n=13,则: n! = 13 ...
Leetcode#115 Distinct Subsequences
原题地址转化为求非重路径数问题,用动态规划求解,这种方法还挺常见的举个例子,S="aabb",T="ab".构造如下地图("."表示空位 ...
JavaScript语言基础知识点图示（转）
一位牛人归纳的JavaScript 语言基础知识点图示. 1.JavaScript 数据类型 2.JavaScript 变量 3.Javascript 运算符 4.JavaScript 数组 5.Ja ...
【leetcode】Contains Duplicate & Rectangle Area（easy）
Contains Duplicate Given an array of integers, find if the array contains any duplicates. Your funct ...
iOS项目的完整重命名方法图文教程
原文链接:http://www.cocoachina.com/ios/20150104/10824.html iOS项目的完整重命名方法图文教程前言:在iOS开发中,有时候想改一下项目的名字,都会遇 ...
Leetcode: strStr()
Implement strStr(). Returns the index of the first occurrence of needle in haystack, or -1 if needle ...
shell如何自动输入密码
shell如何自动输入密码 http://linux.ctocio.com.cn/171/12162171.shtml
【poj1284-Primitive Roots】欧拉函数-奇素数的原根个数
http://poj.org/problem?id=1284 题意:给定一个奇素数p,求p的原根个数. 原根: { (xi mod p) | 1 <= i <= p-1 } is equa ...
Project Euler P105:Special subset sums: testing 特殊的子集和检验
Special subset sums: testing Let S(A) represent the sum of elements in set A of size n. We shall cal ...
Android 核心分析之八Android 启动过程详解
Android 启动过程详解 Android从Linux系统启动有4个步骤: (1) init进程启动 (2) Native服务启动 (3) System Server,Android服务启动 (4) ...

opencv实现KNN手写数字的识别

opencv实现KNN手写数字的识别的更多相关文章

随机推荐

热门专题