简述

最近开发一个项目需要用到Ocr文字识别技术来识别手写文字，在评估过程中体验了百度的文字识别和腾讯的文字识别。查找官方开发文档，发现它们都有印刷体和手写体两种符合项目需求的识别模式，但是腾讯的手写体模式并没找到sdk，只能直接根据文档手动post请求并返回结果，但网上却找不到具体的例子，导致进行过程中出现了一些小困难。这篇文章主要记录一下在Android Studio中百度Ocr的用法(主要参考官方文档)。下篇文章记录腾讯Ocr的用法。

通用识别模式（高精度版）

1.首先需要下载百度文字识别的sdk。SDK下载页面

2.解压缩下载的包，然后进入libs目录，找到ocr-sdk.jar，复制到工程的libs目录下，然后点击Android Studio的Build->Edit Libralies and Dependencies...,点击＋号，再点击jar dependency，找到ocr-sdk.jar并添加即可。

3.查看下载的包的libs目录下，发现有armeabi，arm64-v8a，armeabi-v7a，x86这几个文件夹，选择自己设备对应的文件夹，复制到android studio工程src/main/jniLibs目录中，如果不知道设备的arm架构，可以用Android Studio连接设备，然后在Android Studio的控制台中输入：

adb shell getprop ro.product.cpu.abi

即可查看当前设备的arm架构。

4.添加必要的权限：

<uses-permission android:name="android.permission.INTERNET" />

<uses-permission android:name="android.permission.READ_EXTERNAL_STORAGE"/>

<uses-permission android:name="android.permission.WRITE_EXTERNAL_STORAGE"/>

注意：android6.0以上需要申请动态权限。

5.如果在自己的工程中集成SDK，为了防止release发布时打包报错，需要在Proguard配置文件中增加：

-keep class com.baidu.ocr.sdk.**{*;}

-dontwarn com.baidu.ocr.**

6.在代码中初始化sdk：

    /**

     * 用明文ak，sk初始化

     */

    private void initAccessTokenWithAkSk() {

        OCR.getInstance(mContext).initAccessTokenWithAkSk(new OnResultListener<AccessToken>() {

            @Override

            public void onResult(AccessToken result) {

                String token = result.getAccessToken();

                hasGotToken = true;   //用来判断是否成功获取授权

                ocrNormal();                 //开始文字识别（为了简单起见，直接在这里进行文字识别，实际上使用看项目需要进行判断token）

            }

            @Override

            public void onError(OCRError error) {

                error.printStackTrace();

            }

        }, mContext.getApplicationContext(), "替换成你的Api Key", "替换成你的Secret Key");

    }

Api Key和Secret Key需要去百度开放平台注册获取(百度ai开放平台)。还有一种安全模式授权这里不详说了。

7.开始文字识别：

   private void ocrNormal() {

        // 通用文字识别参数设置

        GeneralBasicParams param = new GeneralBasicParams();

        param.setDetectDirection(true);

        //这里调用的是本地文件，使用时替换成你的本地文件

        File file=getBitmapFile(mBitmap);

        param.setImageFile(file);

      // 调用通用文字识别服务

        OCR.getInstance(mContext).recognizeAccurateBasic(param, new OnResultListener<GeneralResult>() {

            @Override

            public void onResult(GeneralResult result) {

                StringBuilder sb = new StringBuilder();

                // 调用成功，返回GeneralResult对象

                for (WordSimple wordSimple : result.getWordList()) {

                    // wordSimple不包含位置信息

                    WordSimple word = wordSimple;

                    sb.append(word.getWords());

                    //sb.append("\n");

                }

                //file.delete();

                  //String返回

                ocrResult = sb.toString();

                // json格式返回字符串result.getJsonRes())

            }

            @Override

            public void onError(OCRError error) {

                // 调用失败，返回OCRError对象

            }

        });

    }

手写体文字识别

手写体文字识别只需要把上述调用的方法ocrNormal()修改为ocrHandwrite()，然后第7步修改为以下即可：

 private void orcHandwrite() {

        // 通用文字识别参数设置

        OcrRequestParams param = new OcrRequestParams();

        File file=getBitmapFile(mBitmap);

        param.setImageFile(file);

      // 调用通用文字识别服务

        OCR.getInstance(mContext).recognizeHandwriting(param, new OnResultListener<OcrResponseResult>() {

            @Override

            public void onResult(OcrResponseResult ocrResponseResult) {

                //file.delete()；

                // json格式返回字符串

               ocrResult = ocrResponseResult.getJsonRes();

            }

            @Override

            public void onError(OCRError ocrError) {

            }

        });

    }

其中ocrResult返回的是json格式的字符串，需要自己去转换成jsonObject然后读取需要的数据。

两种模式比较

为了比较他们的准确度，我测试了印刷体和手写体两种文字的多个样例，发现一般情况下，都是高精度的普通印刷体模式识别准确率比较高，但是在比较潦草的情况下，手写体识别率比较高（这只是相对而言，实际上潦草字在很多情况下两种模式都未识别成功），所以得出结论，大部分情况下用高精度印刷体文字识别模式即可。

百度Ocr文字识别的更多相关文章

百度OCR 文字识别 Android安全校验
百度OCR接口使用总结: 之前总结一下关于百度OCR文字识别接口的使用步骤(Android版本不带包名配置安全性弱).这边博客主要介绍,百度OCR文字识别接口,官方推荐使用方式,授权文件(安全模式 ...
百度OCR文字识别-Android安全校验
本文转载自好基友upuptop:https://blog.csdn.net/pyfysf/article/details/86438769 效果图: 如下为文章正文: 百度OCR接口使用总结:之前总结 ...
百度OCR文字识别-身份证识别
简介一.介绍身份证识别 API 接口文档地址:http://ai.baidu.com/docs#/OCR-API/top 接口描述用户向服务请求识别身份证,身份证识别包括正面和背面. 请求说明 ...
百度OCR文字识别API使用心得===com.baidu.ocr.sdk.exception.SDKError[283604]
异常com.baidu.ocr.sdk.exception.SDKError[283604]App identifier unmatch.错误的packname或bundleId.logId::303 ...
PHP:基于百度大脑api实现OCR文字识别
有个项目要用到文字识别,网上找了很多资料,效果不是很好,偶然的机会,接触到百度大脑.百度大脑提供了很多解决方案,其中一个就是文字识别,百度提供了三种文字识别,分别是银行卡识别.身份证识别和通用文字识别 ...
小白学Python——用百度AI 实现 OCR 文字识别
百度AI功能还是很强大的,百度AI开放平台真的是测试接口的天堂,免费接口很多,当然有量的限制,但个人使用是完全够用的,什么人脸识别.MQTT服务器.语音识别等等,应有尽有. 看看OCR识别免费的量快 ...
Android OCR文字识别实时扫描手机号（极速扫描单行文本方案）
身份证识别:https://github.com/wenchaosong/OCR_identify 遇到一个需求,要用手机扫描纸质面单,获取面单上的手机号,最后决定用tesseract这个开源OCR库 ...
OCR文字识别笔记总结
OCR的全称是Optical Character Recognition,光学字符识别技术.目前应用于各个领域方向,甚至这些应用就在我们的身边,比如身份证的识别,交通路牌的识别,车牌的自动识别等等.本 ...
怎么给OCR文字识别软件重编文档页面号码
ABBYY FineReader Pro for Mac OCR文字识别软件处理文档时,在FineReader文档中,页面的加载顺序即是页面的导入顺序,完成导入之后,文档的所有页面均会被编号,各编号会 ...

随机推荐

MATLAB下数组随机打乱顺序的方法
一:问题有两个规模相同的数组,两个数组相同位置的元素一一对应,现在要将两数组的元素同时打乱顺序,并且乱序后的两数组对应位置元素要保持乱序前的对应关系. 二:方法采用randperm()函数,产生 ...
MySQL笔记(1)---MySQL体系结构和存储引擎
1.前言本系列记录MYSQL数据库的一些结构和实现特点,方便查询. 2.基本概念数据库:物理操作系统文件或者其他形式文件类型的集合.MySQL中数据库文件可以是frm.MYD.MYI.ibd结尾的 ...
计数排序/Counting Sort
计数排序的算法思想: 对于每一个元素x,只要确定了元素x有多少个比它小的元素,那么就可以知道其最终的位置. 记输入数组为A[n],存放最后排序输出的数组为B[n],提供临时存储空间的中间数组记为C[k ...
Java 9 中，我们可以在匿名类中使用 <> 操作符
不说了,直接上代码: public class NewTest { public static void main(String[] args) { N<Integer> n1 = new ...
C++ string中的几个小陷阱，你掉进过吗？
C++开发的项目难免会用到STL的string,使用管理都比char数组(指针)方便的多,但在得心应手的使用过程中也要警惕几个小陷阱,避免我们项目出bug却迟迟找不到原因. 1. 结构体中的stri ...
Java你不知道的那些事儿—Java隐藏特性（上）
每种语言都很强大,不管你是像我一样的初学者还是有过N年项目经验的大神,总会有你不知道的东西.就其语言本身而言,比如Java,也许你用Java开发了好几年,对其可以说是烂熟于心,但你能保证Java所有的 ...
代理模式——java设计模式
代理模式(Proxy Pattern) GoF中给出的代理模式的定义为: 代理模式给某一个对象提供一个代理或占位符,并由代理对象来控制对原对象的访问. 代理模式的英文叫做Proxy或Surrogate ...
MVC源码分析 - View
感觉好久没有学习了, 汗. 年就这么过完了, 感觉没有尝到过年的味道. 现在的年过的有些冷清了. 除了体重证明着我过了一个年, 还有一件值得开心的事情, 终于把女朋友变成未婚妻了. 这是一大进步吧. ...
spring配置文件引入properties文件：<context:property-placeholder>标签使用总结
一.问题描述: 1.有些参数在某些阶段中是常量,比如: (1)在开发阶段我们连接数据库时的连接url.username.password.driverClass等 (2)分布式应用中client端访问 ...
ajax传递数组到后台，js传递数组到后台
用angular做商品搜索功能,后台接口那边过滤条件必须传递数组过去,结果比较尴尬的事情发生了,每次传递数组过去,查看请求发送的数据,自动被转成了对象,很头疼. 数据传递前传递后我查看了请求的数据 ...

百度Ocr文字识别

简述

通用识别模式（高精度版）

手写体文字识别

两种模式比较

百度Ocr文字识别的更多相关文章

随机推荐

热门专题