C#使用OneNote的图片文字识别功能（OCR）

http://www.cnblogs.com/Charltsing/p/OneNoteOCR.html

有需要技术咨询的，联系QQ564955427

前段时间有人问我能不能通过OneNote扫描图片，并返回文本。经过几天的测试，以及对网上若干个代码的测试，写了一个OneNote 2013下的OCR导入导出工具。

在测试的时候，发现OneNote 2013 提供的API还是有一些问题的，总结如下：

1、OneNote 2013务必升级到最新版，否则调用API的时候，可能会发生异常。本人目前的版本是15.0.4787.1000简体中文版。

2、扫描的语言支持中文和英文，简体版当然默认使用中文识别，但貌似没有办法修改默认语言。也许只能通过修改控制面板中的语言及地区才可以。

3、通过OneNote API做扫描步骤也不复杂，一般都是三~四步，

onenoteApp.CreateNewPage 建立新page

onenoteApp.UpdatePageContent 加入图片的base64数据

onenoteApp.GetPageContent 从返回的XML里面提取OCR Data文本

onenoteApp.DeleteHierarchy 删除新建的page

4、有一些需要注意的问题：

OneNote扫描图片功能如果没有禁用的话，是自动进行的，而且不能获知什么时候识别完毕。只能通过延时语句来估计时间。

onenoteApp.DeleteHierarchy 不太可靠，有的时候没有删除新建的page。建议增加Dispose删除多出来的page（通过title识别即可）

OneNote的DLL不支持嵌入资源，所以不同版本的OneNote需要引用不同的DLL，这可能会给程序的发布带来一些问题。

下图是OneNote2010的识别结果

OneNote2013识别情况要略好些。

***************************************************************************************

最后我把这个OCR封装到了XLL里面，给Excel vba调用，方便批量识别图片文本，并存入Excel。VBA调用代码如下：

C#使用OneNote的图片文字识别功能（OCR）的更多相关文章

小试Office OneNote 2010的图片文字识别功能（OCR）
原文:小试Office OneNote 2010的图片文字识别功能(OCR) 自Office 2003以来,OneNote就成为了我电脑中必不可少的软件,它集各种创新功能于一身,可方便的记录下各种类型 ...
Python图像处理之图片文字识别（OCR）
OCR与Tesseract介绍将图片翻译成文字一般被称为光学文字识别(Optical Character Recognition,OCR).可以实现OCR 的底层库并不多,目前很多库都是使用共同 ...
python3 图片文字识别
最近用到了图片文字识别这个功能,从网上搜查了一下,决定利用百度的文字识别接口.通过测试发现文字识别率还可以.下面就测试过程简要说明一下 1.注册用户链接:https://login.bce.baid ...
JAVA的图片文字识别技术
从2013年的记录看,JAVA中图片文字识别技术大部分采用ORC的tesseract的软件功能,后来渐渐开放了java-api调用接口. 图片文字识别技术,还是采用训练的方法.并未从根本上解决图片与文 ...
一篇文章搞定百度OCR图片文字识别API
一篇文章搞定百度OCR图片文字识别API https://www.jianshu.com/p/7905d3b12104
刚破了潘金莲的身份信息（图片文字识别），win7、win10实测可用(免费下载)
刚破了潘金莲的身份信息(图片文字识别),win7.win10实测可用效果如下: 证照,车牌.身份证.名片.营业执照等图片文字均可识别电脑版本人出品大小1.3MB 下载地址:https://p ...
Python人工智能之图片识别，Python3一行代码实现图片文字识别
1.Python人工智能之图片识别,Python3一行代码实现图片文字识别 2.tesseract-ocr安装包和中文语言包注意:
【图片识别】java 图片文字识别 ocr （转）
http://www.cnblogs.com/inkflower/p/6642264.html 最近在开发的时候需要识别图片中的一些文字,网上找了相关资料之后,发现google有一个离线的工具,以下为 ...
【原】Coursera—Andrew Ng机器学习—课程笔记 Lecture 18—Photo OCR 应用实例:图片文字识别
Lecture 18—Photo OCR 应用实例:图片文字识别 18.1 问题描述和流程图 Problem Description and Pipeline 图像文字识别需要如下步骤: 1.文字侦测 ...

随机推荐

c/c++ 通用的（泛型）算法之只读算法，写算法，排序算法
通用的(泛型)算法之只读算法,写算法,排序算法只读算法: 函数名功能描述 accumulate 求容器里元素的和 equal 比较2个容器里的元素写算法函数名功能描述 fill 用给定值 ...
给html标签加上鼠标划过小手样式
给html标签加上鼠标划过小手样式方法:给当前标签增加样式 style="cursor:pointer;" eg:增加返回箭头样式,给箭头增加小手 <span onclic ...
shell linux 环境下循环遍历文件夹下所有文件
demofun(){ ` do if test -f $file then echo "file: $file" elif test -d $file then echo &quo ...
xshell远程登录工具的星号密码查看方法
当我们在使用ftp,或者xshell等远程登录工具的时候,连接的密码是用星号*处理的,无法查看到,该如何查看到原始的密码呢? 推荐一款星号密码查看器,可以查看一些软件的带星号的密码,非常好用. 下载地 ...
GitHub-标签管理
参考博文:廖雪峰Git教程 1. 创建标签切换到需要打标签的分支上,之后打标签 [root@mini05 zhangtest]# git branch dev * master [root@mini ...
Redis学习笔记--Redis数据过期策略详解
本文对Redis的过期机制简单的讲解一下讲解之前我们先抛出一个问题,我们知道很多时候服务器经常会用到redis作为缓存,有很多数据都是临时缓存一下,可能用过之后很久都不会再用到了(比如暂存sessi ...
vi/vim tab键空格数修改
更改Tap键单位 vi/vim编辑器默认情况下,每按一次Tap相对于8个空格. (1)临时性更改使用vi打开文件后,输入如下命令: :set tabstop=4 命令释义:更改为相当于四个空格. ( ...
springboot事物回滚
要添加事物必须在方法上添加 @Transactional 注解如果需要事物回滚有两个条件 1.方法中有异常或者主动抛异常 2.主动去回滚 TransactionAspectSupport.curr ...
SQL Server 数据导入Mysql具体教程
SQLServer2005数据导入Mysql到具体教程(測试) SQL SERVER数据导入MYSQL文件夹 1.Navicat for MySQL 版本号10.0.9 2.创建目标数据库 3.创 ...
利用filter替换字符串中的空格
s = "abc def ghi xy" print(','.join(filter(lambda x: x, s.split(' '))))

C#使用OneNote的图片文字识别功能（OCR）

C#使用OneNote的图片文字识别功能（OCR）的更多相关文章

随机推荐

热门专题