Python图文识别技术【入门必学】

Python图文识别技术分享

使用 tesseract-ORC 识别文字，识别率不算太高，需要自我训练 tessdata 数据，才能更精确的识别你想要让电脑认识出来的文字！
ps：另外很多人在学习Python的过程中，往往因为遇问题解决不了从而导致自己放弃，为此我建了个Python全栈开发交流.裙：一久武其而而流一思（数字的谐音）转换下可以找到了，里面有最新Python教程项目可拿,不懂的问题有老司机解决哦，一起相互监督共同进步

接下来看代码：

import os

import pytesseract

from PIL import Image

from collections import defaultdict

#pip install pytesseract

#pip install pillow

# tesseract.exe所在的文件路径

pytesseract.pytesseract.tesseract_cmd = 'C://Program Files (x86)/Tesseract-OCR/tesseract.exe'

# 获取图片中像素点数量最多的像素

def get_threshold(image):

    pixel_dict = defaultdict(int)

    # 像素及该像素出现次数的字典

    rows, cols = image.size

    for i in range(rows):

        for j in range(cols):

            pixel = image.getpixel((i, j))

            pixel_dict[pixel] += 1

    count_max = max(pixel_dict.values())  # 获取像素出现出多的次数

    pixel_dict_reverse = {v: k for k, v in pixel_dict.items()}

    threshold = pixel_dict_reverse[count_max]  # 获取出现次数最多的像素点

    return threshold

# 按照阈值进行二值化处理

# threshold: 像素阈值

def get_bin_table(threshold):

    # 获取灰度转二值的映射table

    table = []

    for i in range(256):

        rate = 0.1  # 在threshold的适当范围内进行处理

        if threshold * (1 - rate) <= i <= threshold * (1 + rate):

            table.append(1)

        else:

            table.append(0)

    return table

# 去掉二值化处理后的图片中的噪声点

def cut_noise(image):

    rows, cols = image.size  # 图片的宽度和高度

    change_pos = []  # 记录噪声点位置

    # 遍历图片中的每个点，除掉边缘

    for i in range(1, rows - 1):

        for j in range(1, cols - 1):

            # pixel_set用来记录该店附近的黑色像素的数量

            pixel_set = []

            # 取该点的邻域为以该点为中心的九宫格

            for m in range(i - 1, i + 2):

                for n in range(j - 1, j + 2):

                    if image.getpixel((m, n)) != 1:  # 1为白色,0位黑色

                        pixel_set.append(image.getpixel((m, n)))

            # 如果该位置的九宫内的黑色数量小于等于4，则判断为噪声

            if len(pixel_set) <= 4:

                change_pos.append((i, j))

    # 对相应位置进行像素修改，将噪声处的像素置为1（白色）

    for pos in change_pos:

        image.putpixel(pos, 1)

    return image  # 返回修改后的图片

# 识别图片中的数字加字母

# 传入参数为图片路径，返回结果为：识别结果

def OCR_lmj(img_path):

    image = Image.open(img_path)  # 打开图片文件

    imgry = image.convert('L')  # 转化为灰度图

    # 获取图片中的出现次数最多的像素，即为该图片的背景

    max_pixel = get_threshold(imgry)

    # 将图片进行二值化处理

    table = get_bin_table(threshold=max_pixel)

    out = imgry.point(table, '1')

    # 去掉图片中的噪声（孤立点）

    out = cut_noise(out)

    # 保存图片

    # out.save('E://figures/img_gray.jpg')

    # 仅识别图片中的数字

    # text = pytesseract.image_to_string(out, config='digits')

    # 识别图片中的数字和字母

    text = pytesseract.image_to_string(out)

    # 去掉识别结果中的特殊字符

    exclude_char_list = ' .:\\|\'\"?![],()~@#$%^&*_+-={};<>/¥'

    text = ''.join([x for x in text if x not in exclude_char_list])

    # print(text)

    return text

def main():

    # 识别指定文件目录下的图片

    # 图片存放目录figures

    dir = 'D:\\ProjectSVN\\ChuanShengGuoJi\\trunk\CSGJ\\image2'

    # 遍历figures下的png,jpg文件

    for file in os.listdir(dir):

        if file.endswith('.png') or file.endswith('.jpg'):

            image_path = '%s/%s' % (dir, file)  # 图片路径

            answer = file.split('.')[0]  # 图片名称，即图片中的正确文字

            recognizition = OCR_lmj(image_path)  # 图片识别的文字结果

            print((answer, recognizition))

main()

以上就是分享的代码，都明白了没？另外很多人在学习Python的过程中，往往因为遇问题解决不了从而导致自己放弃，为此我建了个Python全栈开发交流.裙：一久武其而而流一思（数字的谐音）转换下可以找到了，里面有最新Python教程项目可拿,不懂的问题有老司机解决哦，一起相互监督共同进步

本文的文字及图片来源于网络加上自己的想法,仅供学习、交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理。

Python图文识别技术【入门必学】的更多相关文章

Python 入门必学经典知识点笔记【肯定有你不知道的】
前言本文的文字及图片来源于网络,仅供学习.交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理.作者:实验楼 Python 作为近几年越来越流行的语言,吸引了大量的学员开始学 ...
[新手必备]Python 基础入门必学知识点笔记
Python 作为近几年越来越流行的语言,吸引了大量的学员开始学习,为了方便新手小白在学习过程中,更加快捷方便的查漏补缺.根据网上各种乱七八糟的资料以及实验楼的 Python 基础内容整理了一份极度适 ...
使用Code First建模自引用关系笔记 asp.net core上使用redis探索(1) asp.net mvc控制器激活全分析语言入门必学的基础知识你还记得么？反射
使用Code First建模自引用关系笔记原文链接一.Has方法: A.HasRequired(a => a.B); HasOptional:前者包含后者一个实例或者为null HasR ...
Python入门必学：数据类型和变量的用法
什么是数据类型?计算机顾名思义就是可以做数学计算的机器,因此,计算机程序理所当然地可以处理各种数值.但是,计算机能处理的远不止数值,还可以处理文本.图形.音频.视频.网页等各种各样的数据,不同的数据, ...
Python入门必学：字符串和编码正确的使用方法
字符编码,我们已经讲过了,字符串也是一种数据类型,但是,字符串比较特殊的是还有一个编码问题. 因为计算机只能处理数字,如果要处理文本,就必须先把文本转换为数字才能处理.最早的计算机在设计时采用8个比特 ...
Python入门必学：递归函数正确的操作使用方法，案例详解
递归函数,在函数内部,可以调用其他函数.如果一个函数在内部调用自身本身,这个函数就是递归函数. 举个例子,我们来计算阶乘n! = 1 x 2 x 3 x ... x n,用函数fact(n)表示,可以 ...
Python入门必学，用Python练习画个美队盾牌
0 环境 Python版本:3.6.6 操作系统:Mac OS Mojave 10.14.2 1 引言最近我媳妇每天晚上吃饭时候也拿手机看,上厕所也在看. 看着看着还会笑?WTF?你在干嘛呢? 没错 ...
Python之Flask项目开发【入门必学】
前言本文的文字及图片来源于网络,仅供学习.交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理.作者:藤藤菜丶 Flask 安装Flask模块创建一个Flask项目运行 ...
Python之数据分析工具包介绍以及安装【入门必学】
前言本文的文字及图片来源于网络,仅供学习.交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理. 首先我们来看 Mac版按照需求大家依次安装,如果你还没学到数据分析,建议你 ...

随机推荐

Multisim 如何调整编辑界面大小
1.option -> sheet properties 2.选择workspace
C语言 exit
C语言 exit 在main函数中调用exit和return结果是一样的,但在子函数中调用return只是代表子函数终止了,在子函数中调用exit,那么程序终止. 案例 #include <st ...
HahMap相关问题
概述文章对HashMap的部分细节进行介绍,JDK1.7之前有可能出现环形表的问题,而1.7之后进行了改进,文章对环形表现象的出现进行了解析,然后对HashMap注意的几个问题进行了解答. Hash ...
SpringAOP学习之5种通知
一.Spring的AOP分为以下5种类型通知 ①前置通知(Before):在连接点执行前执行该通知 ②正常返回通知(AfterReturning):在连接点正常执行完后执行该通知,若目标方法执行异常则 ...
javascipt——jQuery
1.首先需要导入jQuery1.12.4.js文件,把文件和当前目录放同一目录下.在<body>中写上<script scr = 'jQuery1.12.4.js'><s ...
Vue - 如何使用npm run build后的dist文件夹
脚手架vue cli生成项目后,使用 npm run build 生成了一个dist文件夹(应该是distribution的缩写) 只要放在http服务器上就可以运行. 使用一句python命令可以搭 ...
图片上传至/target/upload目录下后，通过ip:port/upload/无法访问
做以下配置即可 @Override public void addResourceHandlers(ResourceHandlerRegistry registry) { try { registry ...
Ip2Region IP转化地址位置
Ip2Region有中文和数据结构支持,是一个很好的第三方ip转换工具. java: <dependency> <groupId>org.lionsoul</groupI ...
txt文件太大打不开怎么办
#开始最近在调试代码的时候,生成了一个400MB的日志文件找了很多文本编辑器,都表示太大了打不开 QAQ #解决方案百度下载 “txt杀手” 用这个软件把文本文件拆分成小份就可以打开了输入如图 ...
ZooKeeper下载安装配置-单机版配置
1,下载地址:http://apache.fayea.com/zookeeper/ 2,检查环境变量(需要确保配置了环境变量): java -version 3,安装配置: (1)解压 tar -zx ...

Python图文识别技术【入门必学】

Python图文识别技术【入门必学】的更多相关文章

随机推荐

热门专题