Android ocr识别文字介绍(文字识别)

最近在做身份证号码识别，在网上搜索的一番后发现目前开源的OCR中tesseract-ocr算是比较强大的了，它由HP于1985年到1995年间开发，后来由google直接负责，经过谷歌进一步开发后，目前的tesseract-ocr有了显著的改进。

tesseract-ocr和Leptonica图像库一起工作，它可以读取多种图像格式，并将其转换成超过60种语言的文本。可以工作在Linux，Windows，Mac OSX等系统上，并且可以在android和iphone平台上编译。

目前android版本在这个地址：https://code.google.com/p/tesseract-android-tools/，这个版本需要自己下载很多关联的库文件，我在编译的时候出了很多问题，后来没办法又在网上找到了这个项目：https://github.com/rmtheis/tess-two，说是tesseract-ocr-tool的一个分支，这个版本的好处是很多相关的库都已经为我们配置好了，我们只要git clone下来编译下就行了，github上相关介绍说的很详细，编译的过程这里就不做介绍了，我在编译的时候出现了permission权限的问题，文件的权限用chmod 777 ./ 这个命令修改下就Ok了。最后编译好的在libs下的so文件就是我们开发所需要的库文件。

android中tesseract-ocr的使用在tess-two这个项目中有例子程序，不过写的都比较简单，这里有个开源的识别项目，做的很好：https://github.com/rmtheis/android-ocr，我借鉴的就是这个项目来开发的，但是用过后发现，对于身份证识别的效果并不好，识别率不是很高，而且经常识别不出来。OCR用到的识别库：https://code.google.com/p/tesseract-ocr/downloads/list，其实我们可以根据自己的需求来训练一套自己的识别库的，比方说我们要识别验证码，识别身份证号码等，我们就可以用下面的方法来训练一套识别库。

网上关于OCR训练的方法很多，http://my.oschina.net/lixinspace/blog/60124， http://blog.wudilabs.org/entry/f25efc5f/这两篇文章都是比较好的教程，我也是参照这两篇文章来训练的，下面结合我的操作经验来说下训练的过程。

首先我们需要下面几个工具：

tesseract-ocr-3.01，最新版的3.02我在我机器上用了有点问题

jTessBoxEditor, 该工具是用java写的box编辑器

1、先新建一个trainocr文件夹，将上面两个文件拷贝进来，然后解压这两个文件，我们进入Tesseract-ocr文件夹下新建一个temp文件夹

2、接下来我们准备好我们需要训练的素材如下图

要想提高识别率，我们需要提供多张像上面这样的图片，我训练身份证号码识别库是用了50多张图片，等训练完了我眼睛也花了，图片格式需要为tiff格式的，可以通过windows自带的画图工具来另存为tiff格式，准备好多张图tiff图片后，打开jTessBoxEditor.jar，如下图

在此之前我们需要在第1步建立的temp文件夹下新建一个custom.tif的文件，接下来我们选择tool–>Merge TIFF 然后选择准备好的多张tiff图片，注意这里是全部选中，然后点击打开，然后选中我们刚刚建立的custom.tif文件，点击保存，这样我们就将多张tiff图片merge到了一个文件里面了。

3、接下来我们开始生成box文件了，cmd命令行进入temp文件夹下，然后输入如下命令

D:\Trainocr\Tesseract-ocr\temp>..\tesseract.exe custom.tif custom batch.nochop makebox

输入完后会在temp文件夹下多了个custom.box文件，该文件记录了识别出来的每个字和它对应的位置坐标。

4、接下来就开始矫正了，同样使用jTessBoxEditor工具，我们切换到Box Editor，然后open打开custom.tif，如图

通过右上角的X,Y,W,H对每个需要改正的字符进行调整，注意调整好后别忘记保存。

5、接下来是计算字符集，输入如下命令

D:\Trainocr\Tesseract-ocr\temp>..\unicharset_extractor.exe custom.box

6、接下来我们需要在temp文件夹下建一个font_properties文件，3.01版本的OCR需要这个文件，该文件的目的是提供输出时识别出来的字体样式信息，文件的格式为

timesitalic 1 0 0 1 0

我们可以根据实际情况新建font_properties，我写的是

custom 0 0 0 0 0

意思是普通字体，没有任何格式。

然后执行以下命令

D:\Trainocr\Tesseract-ocr\temp>..\mftraining.exe -F font_properties -U unicharset custom.tr

7、Clustering，输入命令

D:\Trainocr\Tesseract-ocr\temp>..\cntraining.exe custom.tr

8、此时在temp文件夹下已经有很多文件了，需要把inttemp，Microfeat，normproto，pffmtable，unicharset这几个文件加上前缀custom. （注意有个点号），然后输入以下命令

D:\Trainocr\Tesseract-ocr\temp>..\combine_tessdata.exe custom.

出来的结果中我们需要确定type 1，type3， type4， type5对应的后面数据不能为-1，这样我们就可以用这个新字典来识别了，将生成的custom.traineddata文件拷贝到tessdata文件夹下，然后

tesseract test.jpg result | custom

就可以通过新的字典来识别，测试结果表明，识别率确实提高了。现实应用中我们需要使用多张图片来通过上面的步骤来生成我们需要的识别库，这样识别率才能提高。

顶: 4

踩

Android ocr识别文字介绍(文字识别)的更多相关文章

Android OCR文字识别实时扫描手机号（极速扫描单行文本方案）
身份证识别:https://github.com/wenchaosong/OCR_identify 遇到一个需求,要用手机扫描纸质面单,获取面单上的手机号,最后决定用tesseract这个开源OCR库 ...
OCR文字识别帮助录入文字信息
OCR文字识别是指将图片.照片上的文字内容,直接转换为可编辑文本的过程.目前各行各业不断地应用文字识别产品,解决文字录入工作的烦恼,提高工作效率. OCR文字识别用在哪里? 一个做社区工作的朋友透露, ...
【原】Coursera—Andrew Ng机器学习—课程笔记 Lecture 18—Photo OCR 应用实例:图片文字识别
Lecture 18—Photo OCR 应用实例:图片文字识别 18.1 问题描述和流程图 Problem Description and Pipeline 图像文字识别需要如下步骤: 1.文字侦测 ...
OCR场景文本识别：文字检测+文字识别
一. 应用背景 OCR(Optical Character Recognition)文字识别技术的应用领域主要包括:证件识别.车牌识别.智慧医疗.pdf文档转换为Word.拍照识别.截图识别.网络图片 ...
Windows下训练Tesseract实现识别图片中的文字
介绍 Tesseract是一个基于Apache2.0协议开源的跨平台ocr引擎,支持多种语言的识别,在Windows和Linux上都有良好的支持. 源代码在这: 源码地址有一个编译打包好的Windo ...
python tesseract 识别图片中的文字的乱码问题(ubuntu系统下)
OCR(Optical Character Recognition):光学字符识别,是指对图片文件中的文字进行分析识别,获取的过程. 首先,需要安装 tesseract-ocr(tesseract O ...
C# 10分钟完成百度图片提取文字（文字识别）——入门篇
现在图片文字识别已经很成熟了,比如qq长按图片,点击图片识别就可以识别图片的文字,将不认识的.文字数量大的.或者不能赋值的值进行二次可复制功能. 我们现在就基于百度Ai开放平台进行个人文字识别,dem ...
VIN码识别，车架号识别，OCR扫描工具
近年二手车交易市场火爆,对二手车估值需要了详细解二手车的历史状况,车架号(VIN码)是车辆唯一的身份标识,也是了解二手车车况的入口,车商和二手车平台会频繁的进行车况查询,VIN码扫描识别技术给车辆估值 ...
Android Studio软件技术基础 —Android项目描述---1-类的概念-android studio 组件属性-+标志-Android Studio 连接真机不识别其他途径
学习android对我来说,就是兴趣,所以我以自己的兴趣写出的文章,希望各位多多支持!多多点赞,评论讨论加关注. 最近有点忙碌,对于我来说,学习Android开发,是对于我的考验,最近一位大佬发给我一 ...

随机推荐

Ubuntu+apt-get update时的源
源是通过 /etc/apt/sources.list # file /etc/apt/sources.list.d # dir 来确定的, 只要将其中的相应文件/相应行删除了, 在apt-get up ...
Python面向对象——多重继承大揭秘
1如果如图所示使用多重继承,我们将看到什么 2我们看到了基类被执行了两次Baseclass 3代码验证吧 class BaseClass: num_base_calls = 0 def call_me ...
linux系统命令学习系列8-文件相关操作touch,rm,mv,cat,head,tail命令
上节内容: 系统和目录管理 Pwd命令 .和..目录相对路径和绝对路径作业:进入opt路径,分别使用相对路径方法和绝对路径方法进入到其实任意一个子目录 cd /opt 相对路径 cd rh 绝对路 ...
【转】C++ Vector（向量容器）
转自:https://blog.csdn.net/studentyyl/article/details/21177445 vector是一个线性顺序结构.相当于数组,但其大小可以不预先指定,并且自动扩 ...
字符串的一些常用方法 string
##字符串## 字符串: 由0个或多个字符组成,被成对的英文单引号或双引号包含起来的. 字符编码: 每一个字符在计算机存储的编号. 计算机会保存有一套或几套用于标注编号与字符对应关系的字典.(字符集) ...
org.apache.commons.lang3.tuple.Pair 作为更新参数，XML 中的 Sql 取不到值、报错
项目用的 Mybatis,今天改一个需求,落地实现是批量更新,且只需要根据主键(id)来更新一个字段(name). 于是,没有犹豫,像下面这样设计了数据结构: 既然是批量更新,那外层肯定是 List ...
洛谷P2042 [NOI2005]维护数列
#include<cstdio> #include<cstdlib> #include<algorithm> #include<cstring> #in ...
【NOIP2016TG】solution
传送门:https://www.luogu.org/problem/lists?name=&orderitem=pid&tag=83%7C33 D1T1(toys) 题意:有n个小人, ...
bzoj 2594: [Wc2006]水管局长数据加强版
Description SC省MY市有着庞大的地下水管网络,嘟嘟是MY市的水管局长(就是管水管的啦),嘟嘟作为水管局长的工作就是:每天供水公司可能要将一定量的水从x处送往y处,嘟嘟需要为供水公司找到一 ...
SpringCloud学习之SpringCloudStream&集成kafka
一.关于Spring-Cloud-Stream Spring Cloud Stream本质上就是整合了Spring Boot和Spring Integration,实现了一套轻量级的消息驱动的微服务框 ...

Android ocr识别文字介绍(文字识别)

Android ocr识别文字介绍(文字识别)的更多相关文章

随机推荐

热门专题