Tesseract 引擎翻译
Tesseract 引擎翻译
Category: 图像识别
Last Edited: Sep 17, 2018 10:29 AM
Tags: tesseract,字符识别,翻译
1.英文原文(中文翻译)
OCR options:(OCR选项)
--tessdata-dir PATH Specify the location of tessdata path(指定tessdata路径的位置).
--user-words PATH Specify the location of user words file (指定用户词文件的位置).
--user-patterns PATH Specify the location of user patterns file (指定用户模式文件的位置).
-l LANG[+LANG] Specify language(s) used for OCR (指定用于OCR的语言).
-c VAR=VALUE Set value for config variables Multiple -c arguments are allowed.(配置变量的设置值。 -c允许多个参数。).
--psm NUM Specify page segmentation mode (指定页面分段模式).
--oem NUM Specify OCR Engine mode (指定OCR引擎模式).
NOTE: These options must occur before any configfile.
Page segmentation modes:
0 Orientation and script detection (OSD) only (仅限方向和脚本检测(OSD)。).
1 Automatic page segmentation with OSD (使用OSD自动分页).
2 Automatic page segmentation, but no OSD, or OCR (自动页面分割,但没有OSD或OCR).
3 Fully automatic page segmentation, but no OSD. (Default) 全自动页面分割,但没有OSD(默认)
4 Assume a single column of text of variable sizes.(假设一列可变大小的文本)
5 Assume a single uniform block of vertically aligned text.(假设一个垂直对齐文本的统一块)
6 Assume a single uniform block of text.(假设一个统一的文本块)
7 Treat the image as a single text line.(将图像视为单个文本行)
8 Treat the image as a single word.(将图像视为单个单词)
9 Treat the image as a single word in a circle.(将图像视为圆形中的单个单词。)
10 Treat the image as a single character.(将图像视为单个字符。)
11 Sparse text. Find as much text as possible in no particular order.(稀疏文字。找到尽可能多的文本,没有特定的顺序。)
12 Sparse text with OSD.(带OSD的稀疏文本)
13 Raw line. Treat the image as a single text line,bypassing hacks that are Tesseract-specific.(将图像视为单个文本行)
***OCR Engine modes:***
0 Original Tesseract only.
1 Cube only.
2 Tesseract + cube.
3 Default, based on what is available.
***Single options:***
-h, --help Show this help message.
--help-psm Show page segmentation modes.
--help-oem Show OCR Engine modes.
-v, --version Show version information.
--list-langs List available languages for tesseract engine.
--print-parameters Print tesseract parameters to stdout.
Tesseract 引擎翻译的更多相关文章
- NET 2.0 OCR文字识别技术(Tesseract 引擎)[转]
一.OCR简介 参见http://baike.baidu.com/view/17761.htm?fr=ala0_1 大家参照,我第一次也是这么了解的,呵呵.高手见笑 现在市面上好多OCR 引擎,不 ...
- Tesseract引擎编译
1. 工具包下载链接 libtiff 4.09 http://download.osgeo.org/libtiff/tiff-4.0.9.zip leptonica 1.76.0 http://www ...
- Tesseract:简单的Java光学字符识别
1.1 介绍 开发具有一定价值的符号是人类特有的特征.对于人们来说识别这些符号和理解图片上的文字是非常正常的事情.与计算机那样去抓取文字不同,我们完全是基于视觉的本能去阅读它们. 另一方面,计算机的工 ...
- selenium使用笔记(二)——Tesseract OCR
在自动化测试过程中我们经常会遇到需要输入验证码的情况,而现在一般以图片验证码居多.通常我们处理这种情况应该用最简单的方式,让开发给个万能验证码或者直接将验证码这个环节跳过.之前在技术交流群里也跟朋友讨 ...
- Tesseract-OCR引擎 入门
OCR(Optical Character Recognition):光学字符识别,是指对图片文件中的文字进行分析识别,获取的过程. Tesseract:开源的OCR识别引擎,初期Tesseract引 ...
- Tomcat中JSP引擎工作原理
http://blog.csdn.net/linjiaxingqqqq/article/details/7164449 JSP运行环境: 执行JSP代码需要在服务器上安装JSP引擎,比较常见的引擎有W ...
- JSP引擎的工作原理
JSP运行环境: 执行JSP代码需要在服务器上安装JSP引擎,比较常见的引擎有WebLogic和Tomcat.把这些支持JSP的web服务器配置好后.就可以再客户端通过浏览器来访问JSP页面了.默认端 ...
- OCR图片识别引擎
OCR引擎 OCR(Optical Character Recognition)是指使用扫描仪或数码相机对文本资料进行扫描成图像文件,然后对图像文件进行分析处理,自动识别获取文字信息及版面信息的软件. ...
- R+OCR︱借助tesseract包实现图片文本提取功能
2016年11月,Jeroen Ooms在CRAN发布了tesseract包,实现了R语言对简单图片的文本提取.分析功能. 利用开源OCR引擎进行图片处理,目前可以识别超过100种语言,R语言可以借助 ...
随机推荐
- 我的C#跨平台之旅(一):从 Hello World 开始
创建一个“控制台应用程序”,目标框架为“.NET Framework 4.5”,并移除无关的文件及引用,仅保留对 “system.dll”的引用:其中工程文件中核心内容如下: 使用NuGet添加如下引 ...
- codefores 1066 E. Binary Numbers AND Sum
这个题吧 你画一下就知道了 就拿这个例子来讲 4 5100110101 对于b串的话第5位只会经过a串的第4位,b串的第4位会经过a串的第3位和第4位.....b串的第1和第2位会经过a串的每一位 由 ...
- day24_雷神_django项目部署
# django项目部署 ... curl -I www.baidu.com 得到响应头信息 vim 里shift + % 找括号的另一半 find / -name virtualenv 3.创建虚拟 ...
- java获取当前日期的前一天和后一天
/** * 获得指定日期的前一天 * @param specifiedDay * @return * @throws Exception */ public static String getSpec ...
- java导出2007版word(docx格式)freemarker + xml 实现
http://blog.csdn.net/yigehui12/article/details/52840121 Freemarker+xml生成docx 原理概述:word从2003版就支持xml格式 ...
- MySQL优化--INSERT ON DUPLICATE UPDATE死锁
INSERT ON DUPLICATE UPDATE与死锁 在MySQL中提供两种插入更新的方式:REPLACE INTO和INSERT ON DUPLICATE UPDATE,简化了“存在则更新,不 ...
- Java集合排序(面试必考点之一)
集合是Java面试必考知识点,而集合的排序也是非常重要的,工作中经常用到,那么这个知识点也是必须要掌握的,下面是我曾经面试时被面试官问的问题: 根据API可知,Java集合的工具类Collection ...
- 1.TabActivity、视图树、动画
整个页面为TabActivity, 其中对TabWidget进行了一些改变,当切换页签时页签后面红色背景会以Translate动画形式移动到相对应的页签后. 布局 )); lastPosition = ...
- 吴恩达机器学习笔记21-正则化线性回归(Regularized Linear Regression)
对于线性回归的求解,我们之前推导了两种学习算法:一种基于梯度下降,一种基于正规方程. 正则化线性回归的代价函数为: 如果我们要使用梯度下降法令这个代价函数最小化,因为我们未对theta0进行正则化,所 ...
- rabbitMQ的安装和创建用户
rabbitMQ的安装和创建用户 在计算机科学中,消息队列(英语:Message queue)是 一种 进程间通信或同一进程的不同 线程 间的通信方式,软件的贮列用来处理一系列的输入,通常是来自用户. ...