用ABBYY提取文本和表格的方法
在ABBYY FineReader 12 OCR文字识别软件中,有一个插件ABBYY Screenshot Reader,通常情况下与ABBYY FineReader 12一起安装到计算机中,它是一款易于使用的智能型应用程序,可以从屏幕上的任何区域抓取图像和文本,且能够将这些图像和文本转换为可编辑的格式,无需再重新输入,使得重新利用数字文档、电子邮件或报告内容变得简单,支持超过180种语言,识别精确度也很出色。
只需点击几下,便可从打开的文档、文件菜单、网页、演示文稿、Flash内容和PDF文件中创建图像和文本“截屏”,本文具体为大家介绍ABBYY Screenshot Reader功能之提取文本和表格。

提取文本和表格
1、将文本信息插入到报告中
有时候你需要的文本可能不便于访问,你也许想从网站插入一些统计数据到销售文稿,或是将200页PDF报告或文章中的文本段落插入到论文里,现在只要选择需要的引用,ABBYY Screenshot Reader会将这些引用转换为真正可编辑的文本,提取的文本可以复制到剪贴板,另存为Microsoft Word或Excel文档,也可直接插入到打开的应用程序中。
2、将图像表格转换为可编辑的Excel工作表
将网站上的列表保存到Excel文件。
学习外语时,有时需要将网上所学的单词归纳到Excel文件里,此时Screenshot Reader可以派上用场,不用再手动剪切然后粘贴每个单词。或者,如果你正计划买一个新产品,只需从网站上将卖家列表导出到Excel表格中。
3、从图像文件中提取一段文本
Screenshot Reader可以提取印刷小册子和传单(只可作为图像)中的文本,你所要做的就是选择一段文本,这段文本将自动在Microsoft Word中以可编辑的形式打开。
4、轻松打印行车路线
假如你预定了一家酒店房间,或是准备参加一场公司活动,但有些抵达路线是动画格式的,其他的也都通过单独电子邮件发送,在Screenshot Reader的帮助下,可以轻松添加所有必要的行车信息到Word文档,然后在单独的一张纸上打印出来。
有关ABBYY Screenshot Reader捕捉截屏图像的功能,请参考ABBYY Screenshot Reader功能之捕捉截屏图像。
本文转载于:http://www.abbyychina.com/FRshiyongjiqiao/abbyyfr-sr-tqwbbg.html
用ABBYY提取文本和表格的方法的更多相关文章
- hanlp提取文本关键词的使用方法记录
		
本文是csu_zipple 分享的关于使用hanlp汉语言处理包提取关键词的过程一个简单的记录分享.想要使用hanlp提取文本关键词的新手朋友们可以参考学习一下! 如何在一段文本之中提取出相应的关键词 ...
 - Python:解析PDF文本及表格——pdfminer、tabula、pdfplumber 的用法及对比
		
pdf 是个异常坑爹的东西,有很多处理 pdf 的库,但是没有完美的. 一.pdfminer3k pdfminer3k 是 pdfminer 的 python3 版本,主要用于读取 pdf 中的文本. ...
 - 【九天教您南方cass 9.1】 09 提取坐标的几种方法
		
同学们大家好,欢迎收看由老王测量上班记出品的cass9.1视频课程 我是本节课主讲老师九天. 我们讲课的教程附件也是共享的,请注意索取测量空间中. [点击索取cass教程]5元立得 (给客服说暗号:“ ...
 - Jsoup提取文本时保留标签
		
使用Jsoup来对html进行处理比较方便,你可能会用它来提取文本或清理html标签.如果你想提取文本时保留标签,可以使用Jsoup.clean方法,参数为html及标签白名单: Jsoup.clea ...
 - java从pdf中提取文本
		
一(单文件转换):下载pdfbox包,百度搜pdfbox.(fontbox-1.8.16.jar和pdfbox-app-1.8.16.jar) package pdf; import java.io. ...
 - C# 在Word中添加表格的方法
		
表格是组织整理数据的一种重要手段,应在生活中的方方面面.在Word文档中将繁杂的文字表述内容表格化,能快速.直接地获取关键内容信息.那么,通过C#,我们也可以在Word文档中添加表格,这里将介绍两种不 ...
 - bat如何提取文本指定行的内容
		
背景:使用CTS框架运行完测试后,会在logs中生成devices_log和host_log,在results中生成相应的结果(报告).根据报告信息我们可以得知失败的用例,但是却不能知道为什么用例会失 ...
 - 用python解析pdf中的文本与表格【pdfplumber的安装与使用】
		
我们接触到的很多文档资料都是以pdf格式存在的,比如:论文,技术文档,标准文件,书籍等.pdf格式使得用机器从中提取信息格外困难. 为了解决这个问题,我找到了几种解决方案,最后选择了python上的p ...
 - SnowNLP:•中文分词•词性标准•提取文本摘要,•提取文本关键词,•转换成拼音•繁体转简体的 处理中文文本的Python3 类库
		
SnowNLP是一个python写的类库,可以方便的处理中文文本内容,是受到了TextBlob的启发而写的,由于现在大部分的自然语言处理库基本都是针对英文的,于是写了一个方便处理中文的类库,并且和Te ...
 
随机推荐
- Shell终端配置
			
Shell终端配置 How to: Change / Setup bash custom prompt (PS1) 参考链接:https://www.cyberciti.biz/tips/howto- ...
 - matlab实现感知机算法--统计学习小灶
			
clear all; clc; %% %算法 %输入:训练数据集T = {(x1,y1),(x2,y2),...,(xn,yn)};学习率η %输出:w,b;感知机模型f(x) = sign(w*x+ ...
 - Yii 提示Invalid argument supplied for foreach() 等错误
			
Yii 提示Invalid argument supplied for foreach() 或者 undefined variable: val等错误 只需要在对应的文件中加入error_report ...
 - Windows Store App 用户库文件分组
			
在Windows应用商店应用程序中浏览用户库中的文件时,可以将文件或者文件夹分组显示,以便于进行分类浏览,这类似于音乐库中的文件可以按照艺术家名称.创建日期或者评级等多种方式进行分类.本节内容将会介绍 ...
 - SoapUI API + Groovy API + Difference with Java
			
用soapUI进行webservice测试过程中,必不可少的要用到soapUI封装的代码.我们一起学习吧:) SoapUI 5.1.2 API:http://www.soapui.org/apidoc ...
 - HBase with MapReduce (MultiTable Read)
			
hbase当中没有两表联查的操作,要实现两表联查或者在查询一个表的同时也需要访问另外一张表的时候,可以通过mapreduce的方式来实现,实现方式如下:由于查询是map过程,因此这个过程不需要设计re ...
 - jQuery 的原型关系图,整体把握jQuery
			
若干个月前,在博客园中看到一篇文章,内容很简单,就是一幅图,展示的是 jQuery 中各对象之间的关系,当时就觉得,这就是我想要的最直观的总结 jQuery 的方式.在那篇文章中,也有 ...
 - 模仿MFC封装Windows API
			
.... 最后添加了两个按钮,分别处理每个按钮的单击事件时,走了弯路,本来想的是在QButton中重写OnLButtonDown方法,但是,无法区分是那个按钮.参考这篇文章: http://zhida ...
 - 三部曲二(基本算法、动态规划、搜索)-1003-Lucky and Good Months by Gregorian Calendar
			
模拟加阅读题......虽然很多事常识性的知识,但也有许多不知道的知识,关键是不读不知道那些是已经知道的那些不是,许多重要的信息零散的分布在一大坨英文里,读起来很痛苦......自己读了一遍,读的晕晕 ...
 - Spring框架学习(二)
			
一.依赖注入的三种注入方式 Spring框架为我们提供了三种注入方式:set注入.构造方法注入和接口注入. 1.set注入 规律:无论给什么赋值,配置文件中<property>标签的nam ...