tesseract系列（2） -- tesseract的使用

上文说了怎么编译成库，这次说说怎么使用，先验证下编译出来的结果。

下图是debug生成的文件，里面有个tesseract的应用程序。

cmd进入目录下，执行命令：tesseract eurotext.tif euro

eurotext.tif是当前目录下要识别的图片，tif是一种图片的格式，在没接触tesseract之前，我都没听过这种格式，还是特地百度的，可能我是真的菜。

执行完命令以后，会在当前目录下生成一个euro .txt的文件，里面就是识别出来的内容。

新建vs工程，把tiff库和头文件，还有leptonica的库和头文件都加到工程。

如果你是使用的方法2，可能这些文件都很容易的找到，如果是方法1 怎么办呢？

首先说leptonica：

因为我们是使用的cppan自动下载的，所以也不知道存放在什么地方，而且据我测试，不同的电脑，存放的位置也不一样，告诉你们一个特别鸡贼的办法：

leptonica的头文件有个名字是这个arrayaccess.h的头文件。下载安装everything（一个自动搜索的软件，不会的百度吧，很简单）

搜索arrayaccess.h文件，结果如下：

对这个右键，打开路径，提取所有的.h头文件，完毕。

找dll和lib的时候，搜索 anbloomberg.leptonica，各种库都有了啊

下面找tiff的库：

记住要用\.cppan\目录下的，一般都在C盘，反正很好找，库的名字都一样，数字是库的版本号。

头文件搜索ccmain，然后这些文件夹的下的头文件都需要：

或者你们有自己简单的办法可以用啊，我就是自己一点一点瞎找的，反正挺费劲儿。

库都完事了，下面就是写代码。

#include "baseapi.h"

#include "allheaders.h"

int main()

{

	char *outText;

	tesseract::TessBaseAPI *api = new tesseract::TessBaseAPI();

	if (api->Init(“E:\\tessdata“”, "eng"))

	{

		exit(1);

	}

	Pix *image = pixRead("./eurotext.tif");

	outText = api->GetUTF8Text();

	delete[] outText;

	pixDestroy(&image);

	return 0;

}

注意啊：

if (api->Init(“E:\\tessdata“”, "eng"))

这里init的时候要加入数据集和模型，我是下载的tesseract的安装包，在安装目录中找到的自带的训练模型，tessdata文件件，然后把文件夹的路径写在了init的里面。

都跑通了才开始记录，全靠回忆，有的地方不是很仔细。

tesseract系列（2） -- tesseract的使用的更多相关文章

tesseract系列（3） -- tesseract训练
tessract的训练有个工具叫 jTessBoxEditor 1.jTessBoxEditor是用java写的,首先要装java的环境 jdk-8u191-windows-x64.exe 这个我想从 ...
tesseract系列（1） -- tesseract用vs编译成库
1.下载teseract 下载地址github: https://github.com/tesseract-ocr/tesseract/releases/ 2.编译源码源码的编译有两种方式 ...
tesseract系列（4） -- tesseract训练问题总结
1. 每次训练模型删除目录下,上述重复的名字 2. 生成inttemp.pffmtable文件的时候,如果下述命令(1)不行的话,或者报错,使用命令(2) (1)mftraining -F font_ ...
[PyImageSearch] Ubuntu16.04下针对OCR安装Tesseract
今天的博文是安装和使用光学字符识别(OCR)的Tesseract库的两部分系列的第一部分. 本系列的第一部分将着重于在您的机器上安装和配置Tesseract,然后使用tesseract命令将OCR应用 ...
Tesseract API在VS 2013中的配置以及调用
[Tesseract]Tesseract API在VS 2013中的配置以及调用时间:2016-05-31 20:35:19 阅读:127 评论:0 收藏:0 ...
tesseract api C++使用例子
转自:https://code.google.com/p/tesseract-ocr/wiki/APIExample APIExample API examples Updated Aug 12, 2 ...
Tesseract Ocr引擎
Tesseract Ocr引擎 1.Tesseract介绍 tesseract 是一个google支持的开源ocr项目,其项目地址:https://github.com/tesseract-ocr/t ...
【Tesseract】Tesseract API在VS 2013中的配置以及调用
想要在VS中使用Tesseract库,必须使用经过相对应的VS版本编译过的dll以及lib.比如在VS 2013中,就必须使用在VS 2013中编译过的Tesseract库. 这里我给出经过VS 20 ...
Android开发如何轻松实现基于Tesseract的Android OCR应用程序
介绍此应用程序使用Tesseract 3的Tesseract OCR引擎,该引擎通过识别字符模式( https://github.com/tesseract-ocr/tesseract )来工作. ...

随机推荐

查看 vps 进程网络流量
弄好了 vps 以后,感觉网络流量走的有点多,决定查查看到底什么情况. 首先安装 sar 来看看各个设备消耗的流量 apt-get install sysstat sar 的参数 DEV 表示网口, ...
spring boot redis 缓存（cache）集成
Spring Boot 集成教程 Spring Boot 介绍 Spring Boot 开发环境搭建(Eclipse) Spring Boot Hello World (restful接口)例子 sp ...
BUUCTF-[HCTF 2018]WarmUp
php中可以使用strpos函数与mb_strpos函数获取指定的字符串在别一个字符串中首次出现的位置,也可以使用它们判断一串字符串中是否包含别一个字符串. PHP strpos() 函数查找 &q ...
3DES 原理
3DES的原理: 加密阶段:用密钥1加密->用密钥2解密->用密钥3加密解密阶段:用密钥3解密->用密钥2加密->用密钥1解密版权声明:本文为博主原创文章,未经博主允许不得 ...
Python Learning Day4
---恢复内容开始--- 遇到的模块 NumPy:多维数组的有效操作. 高效的数学函数. Matplotlib:可视化:2D和(最近)3D图 SciPy:大型库实现各种数值算法,例如: 线性和非线性方 ...
String StringBuffer和StringBuilder的区别和联系
1:String,StringBuffer和StringBuilder概念 1.1:String String中使用字符串数组来存储字符串,但是是fianl来修饰的,所以String的内容不可改变. ...
题解 P2622 【关灯问题II】
题目感觉大佬们的代码在读入上的处理比本蒟蒻优秀多了,于是,一个AFO蒟蒻弱弱地提出一下自己的看法 [分析] 首先,对于 \(n\) 那么小,肯定是状压啦对于读入,本蒟蒻开了两个数组来储存每个按钮的 ...
Linux无法连接网络解决方案
上次在VM中装好Linux以后,用xshell可以连接上Linux,可是今天在启动虚拟机打开Linux以后,发现又没有网络连接了,因为要用xshell连接的话首先要知道Linux的ipv4地址,在li ...
内存管理之堆heap
1.什么是堆? 堆(heap)是一种内存管理方式.内存管理对操作系统来说是一件非常复杂的事情,因为首先内存容量很大, 其次就是内存需求在时间和大小块上没有规律(操作系统上运行着几十甚至几百个进程,这些 ...
[Algo] 611. Compress String II
Given a string, replace adjacent, repeated characters with the character followed by the number of r ...

tesseract系列（2） -- tesseract的使用

tesseract系列（2） -- tesseract的使用的更多相关文章

随机推荐

热门专题