利用贝叶斯算法实现手写体识别（Python）

在开始介绍之前，先了解贝叶斯理论知识

https://www.cnblogs.com/zhoulujun/p/8893393.html

简单来说就是：贝叶斯分类是一类分类算法的总称，这类算法均以贝叶斯定理为基础，故统称为贝叶斯分类。而朴素朴素贝叶斯分类是贝叶斯分类中最简单，也是常见的一种分类方法。

那么既然是朴素贝叶斯分类算法，它的核心算法又是什么呢？

贝叶斯公式如下：

P(A|B)=P(B|A)P(A)/P(B)

可以概括为：

完整的代码如下：

#!/usr/bin/python

# -*- coding: utf-8 -*-

#########################################

# Bayes : 用来描述两个条件概率之间的关系

# 参数:        inX: vector to compare to existing dataset (1xN)

#             dataSet: size m data set of known vectors (NxM)

#             labels: data set labels (1xM vector)

#             公式：P(A|B)=P(B|A)P(A)/P(B)

# 输出:       出错率

#########################################

import numpy as npy

import os

import time

#P(B|A)=P(A|B)*P(A)/P(B)

# 数据集目录

dataSetDir ='E:/digits/'

class Bayes:

    def __init__(self):

        self.length=-1

        self.labelrate=dict()

        self.vectorrate=dict()

    def fit(self,dataset:list,labels:list):

        print("训练开始")

        if len(dataset)!=len(labels):

            raise ValueError("输入测试数组和类别数组长度不一致")

        self.length=len(dataset[0])#训练数据特征值的长度

        labelsnum=len(labels) #类别的数量

        norlabels=set(labels) #不重复类别的数量

        for item in norlabels:

            self.labelrate[item]=labels.count(item)/labelsnum #求当前类别占总类别的比例

        for vector,label in zip(dataset,labels):

            if label not in self.vectorrate:

                self.vectorrate[label]=[]

            self.vectorrate[label].append(vector)

        print("训练结束")

        return self

    def btest(self,testdata,labelset):

        if self.length==-1:

            raise ValueError("未开始训练，先训练")

        #计算testdata分别为各个类别的概率

        lbDict=dict()

        for thislb in labelset:

            p = 1

            alllabel = self.labelrate[thislb]

            allvector = self.vectorrate[thislb]

            vnum=len(allvector)

            allvector=npy.array(allvector).T

            for index in range(0,len(testdata)):

                vector=list(allvector[index])

                p*=vector.count(testdata[index])/vnum

            lbDict[thislb]=p * alllabel

        thislbabel=sorted(lbDict,key=lambda x:lbDict[x],reverse=True)[0]

        return thislbabel

#加载数据

def datatoarray(fname):

    arr=[]

    fh=open(fname)

    for i in range(0,32):

        thisline=fh.readline()

        for j in range(0 , 32):

            arr.append(int(thisline[j]))

    return arr

#建立一个函数取出labels

def seplabel(fname):

    filestr=fname.split(".")[0]

    label=int(filestr.split("_")[0])

    return label

#建立训练数据

def traindata():

    labels=[]

    trainfile=os.listdir(dataSetDir+"trainingDigits") # 加载测试数据

    num=len(trainfile)

    trainarr=npy.zeros((num,1024))

    for i in range(num):

        thisfname=trainfile[i]

        thislabel=seplabel(thisfname)

        labels.append(thislabel)

        trainarr[i,]=datatoarray(dataSetDir+"trainingDigits/"+thisfname)

    return trainarr,labels

# 贝叶斯算法手写识别主流程

bys=Bayes()

start = time.time()

# # step 1: 训练数据集

train_data,labels=traindata()

train_data=list(train_data)

bys.fit(train_data,labels)

# # step 2:测试数据集

thisdata=datatoarray(dataSetDir+"testDigits/8_90.txt")

labelsall=[0,1,2,3,4,5,6,7,8,9]

# # 识别单个手写体数字

# test=bys.btest(thisdata,labelsall)

# print(test)

# # 识别多个手写体数字（批量处理）,并输出结果

testfile=os.listdir(dataSetDir+"testDigits")

num=len(testfile)

x=0

for i in range(num):

    thisfilename=testfile[i]

    thislabel=seplabel(thisfilename)

    thisdataarr=datatoarray(dataSetDir+"testDigits/"+thisfilename)

    label=bys.btest(thisdataarr,labelsall)

    print("测试数字是："+str(thislabel)+"  识别出来的数字是："+str(label))

    if label!=thislabel:

        x+=1

        print("识别出错")

print(x)

print("出错率："+str(x/num))

end = time.time()

running_time = end-start

print('程序运行总耗时： %.5f sec' %running_time)

最后运行的结果：

贝叶斯Python代码及数据集下载地址：https://download.csdn.net/download/kongxiaoshuang509/11248193

需要源代码或者有问题的可以私信。

利用贝叶斯算法实现手写体识别（Python）的更多相关文章

朴素贝叶斯算法--python实现
朴素贝叶斯算法要理解一下基础: [朴素:特征条件独立贝叶斯:基于贝叶斯定理] 1朴素贝叶斯的概念[联合概率分布.先验概率.条件概率**.全概率公式][条件独立性假设.] 极大似然估计 ...
朴素贝叶斯算法的python实现方法
朴素贝叶斯算法的python实现方法本文实例讲述了朴素贝叶斯算法的python实现方法.分享给大家供大家参考.具体实现方法如下: 朴素贝叶斯算法优缺点优点:在数据较少的情况下依然有效,可以处理多类 ...
朴素贝叶斯算法的python实现
朴素贝叶斯算法优缺点优点:在数据较少的情况下依然有效,可以处理多类别问题缺点:对输入数据的准备方式敏感适用数据类型:标称型数据算法思想: 朴素贝叶斯比如我们想判断一个邮件是不是垃圾邮件,那么 ...
利用朴素贝叶斯算法进行分类-Java代码实现
http://www.crocro.cn/post/286.html 利用朴素贝叶斯算法进行分类-Java代码实现鳄鱼 3个月前 (12-14) 分类:机器学习阅读(44) 评论(0) ...
朴素贝叶斯算法原理及Spark MLlib实例(Scala/Java/Python)
朴素贝叶斯算法介绍: 朴素贝叶斯法是基于贝叶斯定理与特征条件独立假设的分类方法. 朴素贝叶斯的思想基础是这样的:对于给出的待分类项,求解在此项出现的条件下各个类别出现的概率,在没有其它可用信息下,我 ...
Python机器学习笔记：朴素贝叶斯算法
朴素贝叶斯是经典的机器学习算法之一,也是为数不多的基于概率论的分类算法.对于大多数的分类算法,在所有的机器学习分类算法中,朴素贝叶斯和其他绝大多数的分类算法都不同.比如决策树,KNN,逻辑回归,支持向 ...
机器学习：python中如何使用朴素贝叶斯算法
这里再重复一下标题为什么是"使用"而不是"实现": 首先,专业人士提供的算法比我们自己写的算法无论是效率还是正确率上都要高. 其次,对于数学不好的人来说,为了实 ...
python 贝叶斯算法
自我理解贝叶斯算法也就是通过概率来判断C是属于A类还是B类,下面是具体代码(python3.5 测试通过) 文字流程解释一波 1 ) 加载训练数据和训练数据对应的类别 2) 生成词汇集,就是所有 ...
Python机器学习算法 — 朴素贝叶斯算法（Naive Bayes）
朴素贝叶斯算法 -- 简介朴素贝叶斯法是基于贝叶斯定理与特征条件独立假设的分类方法.最为广泛的两种分类模型是决策树模型(Decision Tree Model)和朴素贝叶斯模型(Naive Baye ...

随机推荐

Python 自学笔记（七）
1.定义函数和调用函数 1-1.定义函数定义函数的语法书写:def 函数名(参数名)(注:括号内可以为空,也可以为多个参数,多个参数间用逗号隔开即可) 由上可以看出,函数默认返回None 2.函数的 ...
SQL中如何使用方向键——lrwrap
Linux alias命令用于设置指令的别名. 用户可利用alias,自定指令的别名.若仅输入alias,则可列出目前所有的别名设置.alias的效力仅及于该次登入的操作.若要每次登入是即自动设好别名 ...
【React自制全家桶】一、Webstrom+React+Ant Design+echarts搭建react项目
前言一.React是Facebook推出的一个前端框架,之前被用于著名的社交媒体Instagram中,后来由于取得了不错的反响,于是Facebook决定将其开源.出身名门的React也不负众望,成功 ...
window.open()详解及浏览器兼容性问题示例探讨
这篇文章主要介绍了window.open()的使用及浏览器兼容性问题方面的知识,感兴趣的朋友可以参考下一.基本语法: window.open(pageURL,name,parameters) 其 ...
osg fbx 绘制坐标轴、控制模型影藏与显示
int main() { osg::ref_ptr<osgViewer::Viewer> viewer1 = new osgViewer::Viewer; osg::ref_ptr< ...
MySQL数据库之主从复制
一)MySQL主从复制的原理 MySQL主从复制是一个异步的复制过程,数据从一个MySQL数据库(master)复制到另一个MySQL数据库(slave),master和slave之间实现主从复制,主 ...
算法习题---3.01猜数字游戏提示（UVa340）
一.题目实现一个经典“猜数字”游戏.给定答案序列和用户猜的序列,统计有多少数字位置正确(A),有多少数字在两个序列都出现过但位置不对(B). 输入包含多组数据.每组输入第一行为序列长度n,第二行是答 ...
Python编译出现错误SyntaxError: Non-ASCII character '\xe7' 时解决方法
转载个解决办法:https://blog.csdn.net/wangchao701123/article/details/57084244 转自https://blog.csdn.net/jim742 ...
iOS-类似微信摇一摇
首先,一直以为摇一摇的功能实现好高大上,结果百度了.我自己也模仿写了一个demo.主要代码如下: 新建一个项目,名字为AnimationShake. 主要代码: - (void)motionBegan ...
Django:django后台传递数据到js中
#奇怪传递字典时前台接收不到???datalist= [{'site': '自强学堂', 'author': '涂伟忠'}]#只要列表能接收# datalist=[[93, 93, 0, 100.01 ...

利用贝叶斯算法实现手写体识别（Python）

利用贝叶斯算法实现手写体识别（Python）的更多相关文章

随机推荐

热门专题