模式识别之ocr---文字识别Tesseract-OCR 进行文字识别 VS2010

近日做铸件文字识别的项目，需要识别铸件上的字符和数字，找到开源的识别库Tesseract，下面简单记录下怎么使用。

首先在项目主页http://code.google.com/p/tesseract-ocr/ 下载库和相应的字库。由于本人使用的是VS2010，其lib和include等库使用的VS2008进行编译的，所以一直出错。用VS2010的同学可以在这里下载编译好的VS2010的相应的库。

然后进行配置，和其他库的配置类似，include lib dll。

#include "allheaders.h"
#include "baseapi.h"
#include "strngs.h"
#include <cv.h>
#include <highgui.h>
#include <iostream>
using namespace cv;
using namespace std;
int _tmain(int argc, _TCHAR* argv[])
{
char *image_path="zj.jpg";
tesseract::TessBaseAPI api;
api.Init(NULL,"eng",tesseract::OEM_DEFAULT);
api.SetPageSegMode(tesseract::PSM_AUTO);
FILE* fin = fopen(image_path, "rb");
if (fin == NULL) {
printf("Cannot open input file: %s\n", image_path);
exit(2);
}
fclose(fin);
PIX *pixs;
if ((pixs = pixRead(image_path)) == NULL) {
printf("Unsupported image type.\n");
exit(3);
}
pixDestroy(&pixs);
STRING text_out;
if (!api.ProcessPages(image_path, NULL, 0, &text_out)) {
printf("Error during processing.\n");
}
cout<<"识别结果为："<<text_out.string();
return 0;
}

http://blog.csdn.net/lanbing510/article/details/28696833

模式识别之ocr---文字识别Tesseract-OCR 进行文字识别 VS2010的更多相关文章

Tessnet2 a .NET 2.0 Open Source OCR assembly using Tesseract engine
http://www.pixel-technology.com/freeware/tessnet2/ Tessnet2 a .NET 2.0 Open Source OCR assembly usin ...
tesseract ocr文字识别Android实例程序和训练工具全部源代码
tesseract ocr是一个开源的文字识别引擎,Android系统中也可以使用.可以识别50多种语言,通过自己训练识别库的方式,可以大大提高识别的准确率. 为了节省大家的学习时间,现将自己近期的学 ...
开源图片文字识别引擎——Tesseract OCR
Tessseract为一款开源.免费的OCR引擎,能够支持中文十分难得.虽然其识别效果不是很理想,但是对于要求不高的中小型项目来说,已经足够用了. 文字识别可应用于许多领域,如阅读.翻译.文献资料的检 ...
Python图像处理之图片文字识别（OCR）
OCR与Tesseract介绍将图片翻译成文字一般被称为光学文字识别(Optical Character Recognition,OCR).可以实现OCR 的底层库并不多,目前很多库都是使用共同 ...
【图片识别】java 图片文字识别 ocr （转）
http://www.cnblogs.com/inkflower/p/6642264.html 最近在开发的时候需要识别图片中的一些文字,网上找了相关资料之后,发现google有一个离线的工具,以下为 ...
Tesseract——OCR图像识别入门篇
Tesseract——OCR图像识别入门篇最近给了我一个任务,让我研究图像识别,从我们项目的screenshot中识别文字信息,so我开始了学习,与大家分享下. 我看到目前OCR技术有很多,最主要 ...
Tesseract ocr 3.02学习记录一
光学字符识别(OCR,Optical Character Recognition)是指对文本资料进行扫描,然后对图像文件进行分析处理,获取文字及版面信息的过程.OCR技术非常专业,一般多是印刷.打印行 ...
基于Tesseract实现图片文字识别
一.简介 Tesseract是一个开源的文本识别[OCR]引擎,可通过Apache 2.0许可获得.它可以直接使用,或者使用API从图像中提取打印的文本,支持多种语言.该软件包包含一个ORC引擎[l ...
Python识别验证码，基于Tesseract实现图片文字识别
一.简介 Tesseract是一个开源的文本识别[OCR]引擎,可通过Apache 2.0许可获得.它可以直接使用,或者使用API从图像中提取打印的文本,支持多种语言.该软件包包含一个ORC引擎[li ...
Tesseract Ocr引擎
Tesseract Ocr引擎 1.Tesseract介绍 tesseract 是一个google支持的开源ocr项目,其项目地址:https://github.com/tesseract-ocr/t ...

随机推荐

du查看文件大小
du+文件名就可以查看文件大小 du+ -h + 文件名也是查看文件大小,只是-h会将文件大小转换成M,G等格式
无法完成安装:'Cannot access storage file '/
今天自己编译了spice-protocol spice-gtk spice qemu,然后想用virsh去创建一个虚机: # virsh define demo.xml 定义域 demo(从 ...
better-scroll的使用
<template> <div> <div> <h2 class="h2">{{msg}}</h2> </div& ...
2019浙师大校赛（浙大命题）（upc复现赛）总结
2019浙师大校赛(浙大命题)(upc复现赛)总结早上九点开始.起得迟了,吃了早饭慌慌张张跑过去,刚到比赛就开始了. 开始分别从前往后和从后往前看题,一开始A题,第一发WA,第二次读题发现漏看了还有 ...
笔试算法题（11）：Josephus环 & Fibonacci序列
出题:Josephus Cycle,约瑟夫环问题.k个数字连成一个环,第一个数字为1.首先从1开始计数删除第m个数字:然后从上次被删除的数字的下一个数字开始计数,删除第m个数字:重复进行第二步直到只剩 ...
js 技巧（八）JS代码判断集锦(之二)
JS代码判断集锦(之二) <INPUT TYPE="button" value="登录" tabindex="4"> < ...
db2数据库，表相乘，直接扩大表数据
T1 表 SEQ表想得到结果集为: 语句: SELECT * FROM (SELECT * FROM seq,t1) u LEFT JOIN t1 ON u.id=t1.id AND u.jjh=t ...
LeetCode（60） Permutation Sequence
题目 The set [1,2,3,-,n] contains a total of n! unique permutations. By listing and labeling all of th ...
LeetCode 122. Best Time to Buy and Sell Stock II （stock problem)
Say you have an array for which the ith element is the price of a given stock on day i. Design an al ...
Mybatis 处理日期格式自动转换
java.lang.String和java.util.Date之间自动转换 @DateTimeFormat(pattern="yyyy-MM-dd")//页面写入数据库时格式化 @ ...

模式识别之ocr---文字识别Tesseract-OCR 进行文字识别 VS2010

模式识别之ocr---文字识别Tesseract-OCR 进行文字识别 VS2010的更多相关文章

随机推荐

热门专题