tesseract-ocr图片识别开源工具
tesseract-ocr图片识别开源工具
今天看同事的ppt,提到了图片识别,又tesseract-ocr,觉得不错,试一下,如果效果好可以用来做验证码的识别
http://code.google.com/p/tesseract-ocr/
tesseract是一款开源工具,我安装了Windows版试水先
1、首先登录首页在‘下载’页面下载
- tesseract-ocr-setup-xx.xx.exe
- chi_sim.traineddata.gz 中文语言包
2、双击即可安装tesserract-ocr,
3、安装中文语言包,将语言包 chi_sim.traineddata.gz 解压到 Tesseract-OCR下
4、写测试代码:
- package com.taobao.voc.tesseract;
- import java.io.BufferedReader;
- import java.io.File;
- import java.io.FileInputStream;
- import java.io.InputStreamReader;
- import java.util.ArrayList;
- import java.util.List;
- import org.jdesktop.swingx.util.OS;
- public class OCR {
- private final String LANG_OPTION = "-l"; //英文字母小写l,并非数字1
- private final String EOL = System.getProperty("line.separator");
- private String tessPath = "D://java_tools//Tesseract-OCR";
- //private String tessPath = new File("tesseract").getAbsolutePath();
- public String recognizeText(File imageFile,String imageFormat)throws Exception{
- File tempImage = ImageIOHelper.createImage(imageFile,imageFormat);
- File outputFile = new File(imageFile.getParentFile(),"output");
- StringBuffer strB = new StringBuffer();
- List<String> cmd = new ArrayList<String>();
- if(OS.isWindowsXP()){
- cmd.add(tessPath+"//tesseract");
- }else if(OS.isLinux()){
- cmd.add("tesseract");
- }else{
- cmd.add(tessPath+"//tesseract");
- }
- cmd.add("");
- cmd.add(outputFile.getName());
- cmd.add(LANG_OPTION);
- //cmd.add("chi_sim");
- cmd.add("eng");
- ProcessBuilder pb = new ProcessBuilder();
- pb.directory(imageFile.getParentFile());
- cmd.set(1, tempImage.getName());
- pb.command(cmd);
- pb.redirectErrorStream(true);
- Process process = pb.start();
- //tesseract.exe 1.jpg 1 -l chi_sim
- int w = process.waitFor();
- //删除临时正在工作文件
- tempImage.delete();
- if(w==0){
- BufferedReader in = new BufferedReader(new InputStreamReader(new FileInputStream(outputFile.getAbsolutePath()+".txt"),"UTF-8"));
- String str;
- while((str = in.readLine())!=null){
- strB.append(str).append(EOL);
- }
- in.close();
- }else{
- String msg;
- switch(w){
- case 1:
- msg = "Errors accessing files.There may be spaces in your image's filename.";
- break;
- case 29:
- msg = "Cannot recongnize the image or its selected region.";
- break;
- case 31:
- msg = "Unsupported image format.";
- break;
- default:
- msg = "Errors occurred.";
- }
- tempImage.delete();
- throw new RuntimeException(msg);
- }
- new File(outputFile.getAbsolutePath()+".txt").delete();
- return strB.toString();
- }
- }
- package com.taobao.voc.tesseract;
- import java.awt.image.BufferedImage;
- import java.io.File;
- import java.io.IOException;
- import java.util.Iterator;
- import java.util.Locale;
- import javax.imageio.IIOImage;
- import javax.imageio.ImageIO;
- import javax.imageio.ImageReader;
- import javax.imageio.ImageWriteParam;
- import javax.imageio.ImageWriter;
- import javax.imageio.metadata.IIOMetadata;
- import javax.imageio.stream.ImageInputStream;
- import javax.imageio.stream.ImageOutputStream;
- import com.sun.media.imageio.plugins.tiff.TIFFImageWriteParam;
- public class ImageIOHelper {
- /**
- * 图片文件转换为tif格式
- * @param imageFile 文件路径
- * @param imageFormat 文件扩展名
- * @return
- */
- public static File createImage(File imageFile, String imageFormat) {
- File tempFile = null;
- try {
- Iterator<ImageReader> readers = ImageIO.getImageReadersByFormatName(imageFormat);
- ImageReader reader = readers.next();
- ImageInputStream iis = ImageIO.createImageInputStream(imageFile);
- reader.setInput(iis);
- //Read the stream metadata
- IIOMetadata streamMetadata = reader.getStreamMetadata();
- //Set up the writeParam
- TIFFImageWriteParam tiffWriteParam = new TIFFImageWriteParam(Locale.CHINESE);
- tiffWriteParam.setCompressionMode(ImageWriteParam.MODE_DISABLED);
- //Get tif writer and set output to file
- Iterator<ImageWriter> writers = ImageIO.getImageWritersByFormatName("tiff");
- ImageWriter writer = writers.next();
- BufferedImage bi = reader.read(0);
- IIOImage image = new IIOImage(bi,null,reader.getImageMetadata(0));
- tempFile = tempImageFile(imageFile);
- ImageOutputStream ios = ImageIO.createImageOutputStream(tempFile);
- writer.setOutput(ios);
- writer.write(streamMetadata, image, tiffWriteParam);
- ios.close();
- writer.dispose();
- reader.dispose();
- } catch (IOException e) {
- e.printStackTrace();
- }
- return tempFile;
- }
- private static File tempImageFile(File imageFile) {
- String path = imageFile.getPath();
- StringBuffer strB = new StringBuffer(path);
- strB.insert(path.lastIndexOf('.'),0);
- return new File(strB.toString().replaceFirst("(?<=//.)(//w+)$", "tif"));
- }
- }
测试代码
- package com.taobao.voc.tesseract;
- import java.io.File;
- import java.io.IOException;
- public class TestOCR {
- /**
- * @param args
- */
- public static void main(String[] args) {
- String path = "d://test4.jpg";
- try {
- String valCode = new OCR().recognizeText(new File(path), "jpg");
- System.out.println(valCode);
- } catch (IOException e) {
- e.printStackTrace();
- } catch (Exception e) {
- e.printStackTrace();
- }
- }
- }
String path = "d://test4.jpg"; 修改为需要测试的图片,最好全中文,如果因为请更换语言包,OCR类中cmd.add("chi_sim");
tesseract-ocr图片识别开源工具的更多相关文章
- tesseract ocr文字识别Android实例程序和训练工具全部源代码
tesseract ocr是一个开源的文字识别引擎,Android系统中也可以使用.可以识别50多种语言,通过自己训练识别库的方式,可以大大提高识别的准确率. 为了节省大家的学习时间,现将自己近期的学 ...
- java使用开源类库Tesseract实现图片识别
Tesseract-OCR支持中文识别,并且开源和提供全套的训练工具,是快速低成本开发的首选. Tess4J则是Tesseract在Java PC上的应用 Tesseract的OCR引擎最先由HP实验 ...
- JAVA OCR图片识别
今天闲来无聊,尝试了一下OCR识别,尝试了以下三种方案: 1.直接使用业界使用最广泛的Tesseract-OCR. Tesseract项目最初由惠普实验室支持,1996年被移植到Windows上,19 ...
- WindowsAPI调用和OCR图片识别
傻了吧唧的装双系统.成功的干崩了原本的系统.现在重装VS.闲的没事胡扯几句. WindowsAPI在每一台Windows系统上开放标准API供开发人员调用.功能齐全.在这里只介绍三个部分. 1.利用A ...
- Android开发学习之路-GSON使用心得(OCR图片识别)
在安卓中解析JSON串可以使用的方法有很多,比如说用官方提供的JSONObject或者谷歌提供的开源库GSON,以及一些第三方开源库. 这里用的是GSON,为了测试方便,借助了一个百度的api,一个图 ...
- python实现百度OCR图片识别
一.直接上代码 import base64 import requests class CodeDemo: def __init__(self,AK,SK,code_url,img_path): se ...
- OCR图片识别引擎
OCR引擎 OCR(Optical Character Recognition)是指使用扫描仪或数码相机对文本资料进行扫描成图像文件,然后对图像文件进行分析处理,自动识别获取文字信息及版面信息的软件. ...
- tesseract ocr文字识别
一.环境搭建 (基于VS2010) 1.下载安装 tesseract-ocr-setup-3.02.02.exe 安装包 ,安装时候最好是在FQ的情况下安装.(安装一点要勾选 Tesseract de ...
- 在Mac上 python中使用tesseract OCR (Pytesser) 识别图片中的文字
仓库地址:https://github.com/RobinDavid/Pytesser brew install tesseract sudo pip install opencv-python 安装 ...
随机推荐
- Mac下phpstorm 浏览器出现 502 bad gateway 解决办法
问题: 在网上搜了好久,都没有合适的解决办法,于是决定分享下自己鼓捣好久解决了的办法,希望能帮到大家. 出现上述情况,一般在phpstorm里都会出现这个提示 我们只需要点击蓝色的进去,或者点phps ...
- IE的CSS相关的BUG(整理一)
本来不想弄这个ie的bug的,真的很想让它快点死掉,可是事与愿违啊,没办法,还是贴出来,以备自用. 这个网页(http://haslayout.net/css/index)上例举了所有的IE和CSS相 ...
- js window.open()弹出窗口参数说明及居中设置
window.open()可以弹出一个新的窗口,并且通过参数控制窗口的各项属性. 最基本的弹出窗口代码 window.open('httP://codeo.cn/'); window.open()各参 ...
- 超好用文件对比工具 – Beyond Compare
超好用文件对比工具 – Beyond Compare,开发中文件.目录对比神器,有了它,再也不用为找不到修改的内容而发愁了. 具备的丰富实用功能: 并列比较文件夹.FTP 网站或 Zip 文件: 为以 ...
- 无限循环的ViewPager
目前情况 在不修改源码的情况下,当ViewPager滑动到最后一个item的时候,他就无法再往右滑动:当ViewPager滑动到第一个item的时候,他也无法再往前滑动.(以上全是废话) 设想 我们可 ...
- codevs 3693 数三角形
/* n*m个点中选3个 再排除三点共线 共线分两类 1 在横线或者竖线上 m*C(n,3) n*C(m,3) 2 在对角线上 这个比较麻烦 以为对角线和矩阵是一一对应的 我们转化成求矩阵 并且保证有 ...
- web第一节课 sql 数据库连接 查询
1.数据库连接语句 <connectionStrings> <add name="yhotel" connectionString="Database= ...
- mongodb一些特性
mongodb 地理位置 mongodb schema mongodb 定时任务 mysql 也有定时任务 mongodb 读写分离 http://blog.csdn.net/sd0902/artic ...
- mysql explain 命令解释
转载http://bzyyc.happy.blog.163.com/blog/static/6143064720115102551554/ key实 际使用的索引.如果为NULL,则没有使用索引.很少 ...
- 你确定你是一个合格的.Net开发人员吗?
做.net开发已有近5年时间,自认掌握的知识比较全面.最近部门需要招人,今天抽空在网上看了一下,发现我了解的还是不够多啊.下面是我大致的罗列了一下作为一名.Net开发人员所需要掌握的只是.看看你是不是 ...