非黑即白--谷歌OCR光学字符识别

# coding=utf-8

#非黑即白--谷歌OCR光学字符识别

# 颜色的世界里，非黑即白。computer表示深信不疑。

# 今天研究一下OCR光学识别庞大领域中的众多分支里的一个开源项目的一个包-tesseract。

#

# 能让机器识别图片是无数工程师梦寐以求的事

# 任何物体只有成功转为二进制才有可能被机器识别，而识别是做出一系列智能行为的前提

#

# 下面以一张验证码为例梳理一下机器识别的思路：

#

# 准备工作：

# 1、取到图片地址，在线转化为图片流或者下载到本地

# 2、PIL, pytesseract 两个包，其实主要用他们中各一个函数，前者是用Image将图片做像素级处理，以便后者用image_to_string将图片转化为字符串

# 3、图像基础知识：RGB所代表的红绿蓝色域均为0-255，三色叠加0代表黑色，255代表白色，区间值即为灰度

#

# 流程：

# 1、读取图片转为Image函数的对象

# 2、转化为灰度图（即黑白图片），进行二值化（强化黑白）

# 3、坐标系去除噪点，继续强化黑白

# 4、转化为字符串（涉及到分割、识别，image_to_string自动做了）

from PIL import Image

from pytesseract import image_to_string

#  接收图片地址,和int类型的灰度值作为阈值，返回黑白图

def parse(img_address, g):

    img = Image.open(img_address)

    # 转化为灰度图

    imgL = img.convert('L')

    # imgL.show()

    img_load = imgL.load()

    print(imgL.size)

    # 遍历宽与高中的每一个像素并依据阈值判断，进行二值化

    for y in range(imgL.size[1]):

        for x in range(imgL.size[0]):

            # 阈值就是寻找灰度的平衡点

            # 小于阈值的数就是向黑色靠拢，直接赋值为黑，大于阈值即向255靠拢，直接赋值为白

            if img_load[x, y] <= g:

                img_load[x, y] = 0

            else:

                img_load[x, y] = 255

    return imgL

# 擦除噪点，对L模式下的图处理

# x,y 像素点坐标

# g 阈值（0-255之间的灰度值）

# n 强度（周围有几个符合阈值的像素点才留下）

def wipe_spot(img, x, y, g, n):

    count = 0

    if img[x - 1, y + 1] == g:

        count += 1

    if img[x, y + 1] == g:

        count += 1

    if img[x + 1, y + 1] == g:

        count += 1

    if img[x - 1, y] == g:

        count += 1

    if img[x + 1, y] == g:

        count += 1

    if img[x + 1, y - 1] == g:

        count += 1

    if img[x, y - 1] == g:

        count += 1

    if img[x + 1, y - 1] == g:

        count += 1

    if count < n:

        img[x, y] = 255

# 示例

imgl = parse("D://1111.jpg", 150)

imgload = imgl.load()

for y in xrange(imgl.size[1]):

    for x in xrange(imgl.size[0]):

        if imgload[x, y] == 0:

            wipe_spot(imgload, x, y, 0, 1)

imgl.show()

print image_to_string(imgl).replace(' ', '')

非黑即白--谷歌OCR光学字符识别的更多相关文章

Ocrad.js – JS 实现 OCR 光学字符识别
Ocrad.js 相当于是 Ocrad 项目的纯 JavaScript 版本,使用 Emscripten 自动转换.这是一个简单的 OCR (光学字符识别)程序,可以扫描图像中的文字回文本. 不像 G ...
6 个优秀的开源 OCR 光学字符识别工具
转自:http://sigvc.org/bbs/thread-870-1-1.html 纸张在许多地方已日益失宠,无纸化办公谈论40多年,办公环境正限制纸山的生成.而过去几年,无纸化办公的概念发生了显 ...
开源OCR光学字符识别
纸张在许多地方已日益失宠,无纸化办公谈论40多年,办公环境正限制纸山的生成.而过去几年,无纸化办公的概念发生了显着的转变.在计算机软件的帮助下,包含大量重要管理数据和资讯的文档可以更方便的以电子形 ...
IT行业新名词--透明手机/OCR(光学字符识别)/夹背电池
透明手机机身设计的一大关键部分是可替换玻璃的使用,利用导电技术,在看不到线路的环境下,让LED发光. 这样的玻璃内含液晶分子,对于内容的显示则是通过电流对分子的刺激来实现.当手机断电后,分子位置会随 ...
[Xcode 实际操作]七、文件与数据-(22)使用OCR光学字符识别技术识别银行卡号码
目录:[Swift]Xcode实际操作本文将演示如何使用光学字符识别技术,识别信用卡上的卡号. OCR技术是光学字符识别的缩写(Optical Character Recognition), 是通过 ...
OCR光学字符识别--STN-OCR 测试
1.同文章中建议的使用ubuntu-python隔离环境,真的很好用参照:http://blog.topspeedsnail.com/archives/5618启动虚拟环境:source env/b ...
text recognizer (OCR) Engine 光学字符识别
https://github.com/tesseract-ocr/tesseract/wiki https://github.com/UB-Mannheim/tesseract/wiki C:\Use ...
OCR技术（光学字符识别）
什么是OCR? OCR英文全称是optical character recognition,中文叫光学字符识别.它是利用光学技术和计算机技术把印在或者写在纸上的文字读取出来,并转换成一种计算机能够接 ...
【OCR技术系列一】光学字符识别技术介绍
注:此篇内容主要是综合整理了光学字符识别和OCR技术系列之一]字符识别技术总览,详情见文末参考文献什么是 OCR? OCR(Optical Character Recognition,光学字符识别 ...

随机推荐

python作业03-文件操作&函数
一.文件处理相关 1.编码问题 (1)请说明python2 与python3中的默认编码是什么?答:Python2默认的字符编码是ASCII,默认的文件编码也是ASCII :python3默认的字符编 ...
C语言第六次作业--数据类型
一.PTA实验作业题目1,简单计算器: 1. 本题PTA提交列表 2. 设计思路定义操作数num1,num2,结果result=0.运算符ch. 输入num1 while (ch=getchar( ...
Httpclient post请求
CloseableHttpClient httpclient = HttpClients.createDefault(); String url = "https://ml.yiche.co ...
poj 3620
题意:给出一个矩阵,其中有些格子干燥.有些潮湿. 如果一个潮湿的格子的相邻的四个方向有格子也是潮湿的,那么它们就可以构成更大的湖泊,求最大的湖泊. 也就是求出最大的连在一块儿的潮湿的格子的数目. # ...
java.lang.Object学习总结
使用Python中的mock模块进行单元测试
在进行单元测试的时候,有时候会遇到这种情况: 出于某些原因,我们不想测试某一部分内容,但是我们想要测试的部分却依赖这部分内容. 这时候,可以使用mock模块来模拟调用这部分内容,并给出返回结果,举例如 ...
Java基础学习笔记十一 Eclipse开发工具
Eclipse是功能强大Java集成开发工具.它可以极大地提升我们的开发效率.可以自动编译,检查错误.在公司中,使用的就是Eclipse进行开发. Eclipse的下载.安装.卸载下载 http:/ ...
网络1711c语言函数作业总结
作业地址:https://edu.cnblogs.com/campus/jmu/JMUC--NE17111712/homework/1335 总结 1.评分细则评分注意事项代码规范问题依旧要重视, ...
关于DLL的创建与使用简单描述（C++、C#）
前言前一段时间在学关于DLL的创建与调用,结果发现网络上一大堆别人分享的经验都有点问题.现在整理分享一下自己的方法. 工具 Microsoft Visual Studio 2017 depends ...
需求分析&原型设计
需求分析&原型设计需求分析访问软件项目真实用户首先本项目的用户是这个需要做简单四则运算的用户(我们团队通过对家里有三四年级小学生(需要做简单四则运算)的简单采访):反映了几个主要的问题: ...

非黑即白--谷歌OCR光学字符识别

非黑即白--谷歌OCR光学字符识别的更多相关文章

随机推荐

热门专题