K近邻实战手写数字识别

1、导包

import numpy as np

import operator

from os import listdir

from sklearn.neighbors import KNeighborsClassifier as KNN

%config ZMQInteractiveShell.ast_node_interactivity='all'

2、定义将图像转换成向量的函数

"""

函数说明：将32x32的二进制图像转换成1x1024向量

Parameters:

    filename - 文件名

Returns:

    returnVect - 返回的二进制图像的1x1024向量

"""

def img2vector(filename):

    # 创建1x1024零向量

    returnVect = np.zeros((1, 1024))

    # 打开文件

    fr = open(filename)

    # 按行读取

    for i in range(32):

        # 读一行数据

        lineStr = fr.readline()

        # 每一行的前32个元素一次添加到returnVect中

        for j in range(32):

            returnVect[0, 32*i + j] = int(lineStr[j])

    # 返回转换后的1x1024向量

    return returnVect

3、定义手写数字识别系统函数

"""

函数说明：手写数字分类测试

Parameters：

    无

Returns：

    无

"""

def handwritingClassTest():

    # 训练集的Labels

    hwLabels = []

    # 返回trainingDigits目录下的文件名

    trainingFileList = listdir('trainingDigits')

    # 返回文件夹下的文件的个数

    m = len(trainingFileList)

    # 初始化训练的Mat矩阵，训练集

    trainingMat = np.zeros((m, 1024))

    # 从文件集中解析出训练集的类别

    for i in range(m):

        # 获得文件的名字

        fileNameStr = trainingFileList[i]

        # 获得分类的数字

        classNumber = int(fileNameStr.split('_')[0])

        # 将获得的类别添加到hwLabels中

        hwLabels.append(classNumber)

        # 将每一个文件的1x1024数据存储到trainingMat矩阵中

        trainingMat[i, :] = img2vector('trainingDigits/%s' % (fileNameStr))

    # 构建KNN分类器

    neigh = KNN(n_neighbors=3, algorithm='auto')

    # 拟合模型，trainingMat为训练矩阵，hwLabels为对应的标签

    neigh.fit(trainingMat, hwLabels)

    # 返回testDigits目录下的文件列表

    testFileList = listdir('testDigits')

    # 错误检查计数

    errorCount = 0.0

    # 测试数据的数量

    mTest = len(testFileList)

    # 从文件中解析出测试集的类别并进行分类测试

    for i in range(mTest):

        # 获得文件的名字

        fileNameStr = testFileList[i]

        # 获得分类的数字

        classNumber = int(fileNameStr.split('_')[0])

        # 获得测试集的1x1024向量，用于训练

        vectorUnderTest = img2vector('testDigits/%s' % (fileNameStr))

        # 获得预测结果

        classifierResult = neigh.predict(vectorUnderTest)

        # 打印

        print('分类返回结果为%d\t真实结果为%d' % (classifierResult, classNumber))

        if(classifierResult != classNumber):

            errorCount += 1.0

    print('总共错了%d个数据\n错误率为%f%%' %(errorCount, errorCount/mTest * 100))

4 运行结果

if __name__ == "__main__":

    handwritingClassTest()

数据集地址：

链接：https://pan.baidu.com/s/1yNi3TJhYtlBr2MFR8rCkaw
提取码：9epj

参考：

1、《机器学习实战》书籍

2、https://github.com/apachecn/AiLearning

3、https://cuijiahua.com/blog/2017/11/ml_1_knn.html

4、深度之眼机器学习实战训练营课后作业（http://www.deepshare.net/）

K近邻实战手写数字识别的更多相关文章

深度学习之PyTorch实战（3）——实战手写数字识别
上一节,我们已经学会了基于PyTorch深度学习框架高效,快捷的搭建一个神经网络,并对模型进行训练和对参数进行优化的方法,接下来让我们牛刀小试,基于PyTorch框架使用神经网络来解决一个关于手写数字 ...
Tensorflow实战手写数字识别（Tensorboard可视化）
一.前言为了更好的理解Neural Network,本文使用Tensorflow实现一个最简单的神经网络,然后使用MNIST数据集进行测试.同时使用Tensorboard对训练过程进行可视化,算是打 ...
一看就懂的K近邻算法(KNN)，K-D树，并实现手写数字识别！
1. 什么是KNN 1.1 KNN的通俗解释何谓K近邻算法,即K-Nearest Neighbor algorithm,简称KNN算法,单从名字来猜想,可以简单粗暴的认为是:K个最近的邻居,当K=1 ...
用MXnet实战深度学习之一:安装GPU版mxnet并跑一个MNIST手写数字识别
用MXnet实战深度学习之一:安装GPU版mxnet并跑一个MNIST手写数字识别 http://phunter.farbox.com/post/mxnet-tutorial1 用MXnet实战深度学 ...
kaggle 实战（1）: PCA + KNN 手写数字识别
文章目录加载package read data PCA 降维探索选择50维度, 拆分数据为训练集,测试机 KNN PCA降维和K值筛选分析k & 维度 vs 精度预测生成提交文件本 ...
机器学习（二）-kNN手写数字识别
一.kNN算法是机器学习的入门算法,其中不涉及训练,主要思想是计算待测点和参照点的距离,选取距离较近的参照点的类别作为待测点的的类别. 1,距离可以是欧式距离,夹角余弦距离等等. 2,k值不能选择太大 ...
keras和tensorflow搭建DNN、CNN、RNN手写数字识别
MNIST手写数字集 MNIST是一个由美国由美国邮政系统开发的手写数字识别数据集.手写内容是0~9,一共有60000个图片样本,我们可以到MNIST官网免费下载,总共4个.gz后缀的压缩文件,该文件 ...
OpenCV+TensorFlow图片手写数字识别(附源码)
初次接触TensorFlow,而手写数字训练识别是其最基本的入门教程,网上关于训练的教程很多,但是模型的测试大多都是官方提供的一些素材,能不能自己随便写一串数字让机器识别出来呢?纸上得来终觉浅,带着这 ...
深度学习面试题12：LeNet(手写数字识别)
目录神经网络的卷积.池化.拉伸 LeNet网络结构 LeNet在MNIST数据集上应用参考资料 LeNet是卷积神经网络的祖师爷LeCun在1998年提出,用于解决手写数字识别的视觉任务.自那时起 ...

随机推荐

PAT Advanced 1011 World Cup Betting (20 分)
With the 2010 FIFA World Cup running, football fans the world over were becoming increasingly excite ...
个人第二次作业-c++实现四则运算生成器
c++实现四则运算生成器 GIT地址 Link Git用户名 Redwarx008 学号后五位 61128 博客地址 Link 作业链接 Link 环境配置使用VS2019社区版,一键式安装,这里不 ...
Codeforces1234F. Yet Another Substring Reverse（状压dp）
题目链接:传送门思路: 由于只能翻转一次子串,就相当于找出两个不连续的子串,把在后面的一个子串翻转过来,和第一个子串拼接. 因为题目仅要求子串中的字符不重复,所以字符的先后顺序无关,翻转的操作就相当 ...
element-ui 表格标题换行
render-header: 列标题 Label 区域渲染使用的 Function <template> <el-table :data="dataList"& ...
DUBBO原理、应用与面经总结
研读dubbo源码已经有一段时间了,dubbo中有非常多优秀的设计模式和示例代码值得学习,但是dubbo的调用层级和方法链都较为繁杂,如果不对源码思路进行梳理则很容易忘却,因此总结一篇研读心得,从阅读 ...
Mixly-指令
串口: 向串口监视器输出数据十进制 Serial.println(ir_item,HEX); 向串口监视器输出数据---十六进制通信: 接收11脚的红外信号,把接收到的数据 ...
【leetcode】622. Design Circular Queue
题目如下: Design your implementation of the circular queue. The circular queue is a linear data structur ...
synchronized 与 lock 的区别
synchronized 和 lock 的用法区别 synchronized(隐式锁):在需要同步的对象中加入此控制,synchronized 可以加在方法上,也可以加在特定代码块中,括号中表示需要锁 ...
C#笔试总结
题一: 程序设计: 猫大叫一声,所有的老鼠都开始逃跑,主人被惊醒.(C#语言)要求: <1>.构造出Cat.Mouse.Master三个类,并能使程序运行 ...
MIF文件生成说明
mif文件就是存储器初始化文件,即memory initialization file,用来配置RAM或ROM中的数据.生成QuartusII11.0可用的mif文件,有如下几种方式: 方法1:利用Q ...

K近邻实战手写数字识别

K近邻实战手写数字识别的更多相关文章

随机推荐

热门专题