Tesseract 引擎翻译

Category: 图像识别
Last Edited: Sep 17, 2018 10:29 AM
Tags: tesseract,字符识别,翻译

1.英文原文（中文翻译）

OCR options:（OCR选项）
--tessdata-dir PATH Specify the location of tessdata path（指定tessdata路径的位置）.
--user-words PATH Specify the location of user words file （指定用户词文件的位置）.
--user-patterns PATH Specify the location of user patterns file （指定用户模式文件的位置）.
-l LANG[+LANG] Specify language(s) used for OCR （指定用于OCR的语言）.
-c VAR=VALUE Set value for config variables Multiple -c arguments are allowed.（配置变量的设置值。 -c允许多个参数。）.
--psm NUM Specify page segmentation mode （指定页面分段模式）.
--oem NUM Specify OCR Engine mode （指定OCR引擎模式）.
NOTE: These options must occur before any configfile.

Page segmentation modes:
0 Orientation and script detection (OSD) only （仅限方向和脚本检测（OSD）。）.
1 Automatic page segmentation with OSD （使用OSD自动分页）.
2 Automatic page segmentation, but no OSD, or OCR （自动页面分割，但没有OSD或OCR）.
3 Fully automatic page segmentation, but no OSD. (Default) 全自动页面分割，但没有OSD（默认）
4 Assume a single column of text of variable sizes.（假设一列可变大小的文本）
5 Assume a single uniform block of vertically aligned text.（假设一个垂直对齐文本的统一块）
6 Assume a single uniform block of text.（假设一个统一的文本块）
7 Treat the image as a single text line.（将图像视为单个文本行）
8 Treat the image as a single word.（将图像视为单个单词）
9 Treat the image as a single word in a circle.（将图像视为圆形中的单个单词。）
10 Treat the image as a single character.（将图像视为单个字符。）
11 Sparse text. Find as much text as possible in no particular order.（稀疏文字。找到尽可能多的文本，没有特定的顺序。）
12 Sparse text with OSD.（带OSD的稀疏文本）
13 Raw line. Treat the image as a single text line,bypassing hacks that are Tesseract-specific.（将图像视为单个文本行）

***OCR Engine modes:***
0 Original Tesseract only.
1 Cube only.
2 Tesseract + cube.
3 Default, based on what is available.

***Single options:***
-h, --help Show this help message.
--help-psm Show page segmentation modes.
--help-oem Show OCR Engine modes.
-v, --version Show version information.
--list-langs List available languages for tesseract engine.
--print-parameters Print tesseract parameters to stdout.

Tesseract 引擎翻译的更多相关文章

NET 2.0 OCR文字识别技术（Tesseract 引擎）［转］
一.OCR简介参见http://baike.baidu.com/view/17761.htm?fr=ala0_1 大家参照,我第一次也是这么了解的,呵呵.高手见笑现在市面上好多OCR 引擎,不 ...
Tesseract引擎编译
1. 工具包下载链接 libtiff 4.09 http://download.osgeo.org/libtiff/tiff-4.0.9.zip leptonica 1.76.0 http://www ...
Tesseract：简单的Java光学字符识别
1.1 介绍开发具有一定价值的符号是人类特有的特征.对于人们来说识别这些符号和理解图片上的文字是非常正常的事情.与计算机那样去抓取文字不同,我们完全是基于视觉的本能去阅读它们. 另一方面,计算机的工 ...
selenium使用笔记（二）——Tesseract OCR
在自动化测试过程中我们经常会遇到需要输入验证码的情况,而现在一般以图片验证码居多.通常我们处理这种情况应该用最简单的方式,让开发给个万能验证码或者直接将验证码这个环节跳过.之前在技术交流群里也跟朋友讨 ...
Tesseract-OCR引擎入门
OCR(Optical Character Recognition):光学字符识别,是指对图片文件中的文字进行分析识别,获取的过程. Tesseract:开源的OCR识别引擎,初期Tesseract引 ...
Tomcat中JSP引擎工作原理
http://blog.csdn.net/linjiaxingqqqq/article/details/7164449 JSP运行环境: 执行JSP代码需要在服务器上安装JSP引擎,比较常见的引擎有W ...
JSP引擎的工作原理
JSP运行环境: 执行JSP代码需要在服务器上安装JSP引擎,比较常见的引擎有WebLogic和Tomcat.把这些支持JSP的web服务器配置好后.就可以再客户端通过浏览器来访问JSP页面了.默认端 ...
OCR图片识别引擎
OCR引擎 OCR(Optical Character Recognition)是指使用扫描仪或数码相机对文本资料进行扫描成图像文件,然后对图像文件进行分析处理,自动识别获取文字信息及版面信息的软件. ...
R+OCR︱借助tesseract包实现图片文本提取功能
2016年11月,Jeroen Ooms在CRAN发布了tesseract包,实现了R语言对简单图片的文本提取.分析功能. 利用开源OCR引擎进行图片处理,目前可以识别超过100种语言,R语言可以借助 ...

随机推荐

[转载]DevOps在传统企业的落地实践及案例分享
内容来源:2017年6月10日,优维科技高级解决方案架构师黄星玲在“DevOps&SRE 超越传统运维之道”进行<DevOps在传统企业的落地实践及案例分享>演讲分享.IT 大咖说 ...
Python学习笔记【第六篇】：迭代器、生成器、高阶函数、装饰器
迭代器迭代器是访问集合元素的一种方式,迭代器从对象的第一个元素开始访问,知道所有元素被访问完成.迭代器只能往前访问,不能通过索引访问. 类型内部使用__iter__()方法转为迭代器,使用__nex ...
bootstrap treeview实现菜单树
本博客,介绍通过Bootstrap的treeview插件实现菜单树的功能. treeview链接:http://www.htmleaf.com/Demo/201502141380.html ORM框架 ...
Java 虚拟机对锁优化所做的努力
作为一款公用平台,JDK 本身也为并发程序的性能绞尽脑汁,在 JDK 内部也想尽一切办法提供并发时的系统吞吐量.这里,我将向大家简单介绍几种 JDK 内部的 "锁" 优化策略. 1 ...
激活IDEA方法
1.需要一个jar包,在 http://idea.lanyus.com/ 下载 2.将jar拷贝到idea安装目录 3.复制jar包路径到如下图两个文件中例:-javaagent:C:\Ap ...
STL::sort函数实现
声明:本文参考链接:STL::sort实现. 排序是面试中经常被问及的算法基础知识点,虽然实际应用中不会直接使用,但是理解这些简单的算法知识对于更复杂更实用的算法有一定的帮助,毕竟面试总不能问的太过深 ...
NodeJS学习笔记 - Apache反向代理集成实现
初学,简单的实现,为进行优化. 1. 假设NodeJS服务端监听3000端口 2. Apache反向代理设置 a. 在httpd.conf配置文件中开启代理模块 LoadModule proxy_mo ...
ionic3 实现扫码功能
ionic3 通过插件phonegap-plugin-barcodescanner,调用机器硬件摄像头实现扫码功能. 首先当然先了解下 phonegap-plugin-barcodescanner,这 ...
Android--解析XML之PULL
前言在上一篇博客已经介绍了Android解析XML的几种方式,分别有:SAX.DOM.PULL.详细的可以看看上一篇博客:http://www.cnblogs.com/plokmju/p/andro ...
基础编程复习：输出n以内的所有素数
暴力遍历:对于1~n以内的每一数i 每一个i只需要考虑2~i开根号以内是否有可以让i整除的数,即(i%x==0)只要满足就不是素数否则输出 #include<iostream> #inc ...

Tesseract 引擎翻译

Tesseract 引擎翻译

Tesseract 引擎翻译的更多相关文章

随机推荐

热门专题