每天进步一点点-Tesseract 文字识别

猝不及防 2024-11-10 23:31:40 原文

Tesseract 文字识别

是github上的开源文字识别软件

下载与安装	https://github.com/tesseract-ocr/tesseract/wiki
下载	https://github.com/UB-Mannheim/tesseract/wiki
数据文件下载	https://github.com/tesseract-ocr/tesseract/wiki/Data-Files
需要添加环境变量	D:\GitHub2019\tesseract-ocr\
返回的out.txt默认字符	utf8
训练字库下载	https://github.com/tesseract-ocr/tesseract/wiki/TrainingTesseract-4.00
命令语法	https://github.com/tesseract-ocr/tesseract/blob/master/doc/tesseract.1.asc

前提条件：

1 在上面的地址下载安装tesseract

2 添加安装路径到windows环境变量

3 下载自己需要的语言库（官方已经训练好）到tessdata目录下

简单使用：

简单使用:

tesseract [imagepath] [outputPath] -l [Language] [optional]

例如:tesseract C:\Users\ZR644\Desktop\tesseract-ocr\myscan.png C:\Users\ZR644\Desktop\tesseract-ocr\out -l chi_sim --psm 7

其中：

1 outputPath输出是不需要加后缀的，只是文件名称，这点有点奇怪

2 output格式是用utf8，有点编码起默认是别的，造成识别失败的假象

3 一开始识别不出不要紧，请按照图片调整参数

4 有一个图片文本占得很满，查了资料说图片要有一圈留白，仅供参考.

5 更多命令请参考本文一开始给出的命令语法页面

c#调用

在Nuget上有封装的tessercat，但是看了一下他的最新版本是用于tesseract-ocr 3.05.02的.NET包装器，而目前最新的版本都4多了，所以不打算用了.

像上面一样通过命令行的方式进行调用，然后读取out.txt文件识别的内容就好了.

简单例子：

做了一个不同psm参数识别同一张图片的具体对比：

下载地址：https://github.com/tiancai4652/IdentifyImageByTesseract

使用前请先安装好，设置好环境变量，下载语言包到其目录下

每天进步一点点-Tesseract 文字识别的更多相关文章

tesseract ocr文字识别Android实例程序和训练工具全部源代码
tesseract ocr是一个开源的文字识别引擎,Android系统中也可以使用.可以识别50多种语言,通过自己训练识别库的方式,可以大大提高识别的准确率. 为了节省大家的学习时间,现将自己近期的学 ...
开源图片文字识别引擎——Tesseract OCR
Tessseract为一款开源.免费的OCR引擎,能够支持中文十分难得.虽然其识别效果不是很理想,但是对于要求不高的中小型项目来说,已经足够用了. 文字识别可应用于许多领域,如阅读.翻译.文献资料的检 ...
Windows下训练Tesseract实现识别图片中的文字
介绍 Tesseract是一个基于Apache2.0协议开源的跨平台ocr引擎,支持多种语言的识别,在Windows和Linux上都有良好的支持. 源代码在这: 源码地址有一个编译打包好的Windo ...
基于Tesseract实现图片文字识别
一.简介 Tesseract是一个开源的文本识别[OCR]引擎,可通过Apache 2.0许可获得.它可以直接使用,或者使用API从图像中提取打印的文本,支持多种语言.该软件包包含一个ORC引擎[l ...
Python识别验证码，基于Tesseract实现图片文字识别
一.简介 Tesseract是一个开源的文本识别[OCR]引擎,可通过Apache 2.0许可获得.它可以直接使用,或者使用API从图像中提取打印的文本,支持多种语言.该软件包包含一个ORC引擎[li ...
文字识别OCR开源框架的对比--Tesseract vs EasyOCR
前言: OCR文字识别在目前有着比较好的应用,也出现了很多的文字识别软件,但软件是面向用户的.对于我们技术人员来说,有时难免需要在计算机视觉任务中加入文字识别,如车牌号识别,票据识别等,因此软件对 ...
识别率很高的java文字识别技术
java文字识别程序的关键是寻找一个可以调用的OCR引擎.tesseract-ocr就是一个这样的OCR引擎,在1985年到1995年由HP实验室开发,现在在Google.tesseract-ocr ...
Android ORC文字识别之识别身份证号等（附源码）
项目地址https://github.com/979451341/OrcTest 我们说说实现这个项目已实现的功能,能够截图手机界面的某一块,将这个某一块图片的Bitmap传给tess-two的代码来 ...
Python图像处理之图片文字识别（OCR）
OCR与Tesseract介绍将图片翻译成文字一般被称为光学文字识别(Optical Character Recognition,OCR).可以实现OCR 的底层库并不多,目前很多库都是使用共同 ...

随机推荐

企业级NginxWeb服务优化实战（下）
企业级NginxWeb服务优化实战(下) 4. Nginx站点目录及文件URL访问控制 4.1 根据扩展名限制程序和文件访问 Web2.0时代,绝大多数网站都是以用户为中心多的,例如:bbs,blog ...
ubuntu批量转换所有子文件夹下图片文件格式
第一步按照 sudo apt-get install imagemagick 对于一个文件,可以: convert ubuntuhandbook.png ubuntuhandbook.jpg 对于多个 ...
游戏game
1.log4cxx 日志 2.protobuf 数据交互(类似json 3.boost.asio 网络库 4.boost.python 脚本支持 5.语法树 + c++处理excel资源
DOM0级事件绑定之js的onclick事件
<!DOCTYPE html> <html lang="en"> <head> <meta charset="UTF-8&quo ...
Java创建线程后，调用start()方法和run()的区别
1) start方法: 用start方法来启动线程,真正实现了多线程运行,这时无需等待run方法体代码执行完毕而直接继续执行下面的代码.通过调用Thread类的start()方法来启动一个线程,这时此 ...
服务注册与发现---spring cloud
Eureka基本架构 Register Service :服务注册中心,它是一个 Eureka Server ,提供服务注册和发现的功能. Provider Service :服务提供者,它是 Eur ...
【leetcode】388. Longest Absolute File Path
题目如下: Suppose we abstract our file system by a string in the following manner: The string "dir\ ...
bzoj1046题解
[解题思路] 先倒着求一遍LIS,然后对于每个询问L从左到右找到第一个大于等于L的上升序列即可.复杂度O(N(log2N+M)). [参考代码] #pragma GCC optimize(2) #in ...
firefox显示您的连接不安全解决办法
在地址栏键入"about:config" 点击“我了解此风险” 在下方任意位置右键,选择新建布尔值输入首选项名称为“security.enterprise_roots.enabl ...
node.js是用来做什么的
Node.js 使用了一个事件驱动.非阻塞式 I/O 的模型,使其轻量又高效.(事件驱动:事件触发过程中,进行决策的一种策略,简单说就是跟随当前时间点上出现的事物,调用可用的资源进行解决该事物,使得不 ...