简述

上篇文章记录了百度Ocr的两种模式用法，接下来这篇文章开始记录腾讯Ocr的使用方法。腾讯Ocr的通用印刷体识别模式使用比较简单，直接接入sdk即可，但手写体的识别相对比较麻烦，需要自己post表单（也可能是能用sdk的，但我是没有找到）

通用文字识别

1.直接在Android Studio的app->build.gradle->dependencies中添加：

 implementation 'com.qcloud:qcloud-image-sdk:2.3.6'

2.初始化识别程序：

ImageClient imageClient = new ImageClient(APPID, SecretId, SecretKey,

ImageClient.NEW_DOMAIN_recognition_image_myqcloud_com);

其中APPID、SecretId、SecretKey这些和百度一样是需要去注册获取的，具体获取方式没什么难度就不详说(点击前往腾讯AI开放平台)。最后一个参数是服务器域名，默认使用新域名，也就是：

ImageClient.NEW_DOMAIN_recognition_image_myqcloud_com

如果是老用户，修改为以下域名：

ImageClient.OLD_DOMAIN_service_image_myqcloud_com

3.开始进行文字识别：

  GeneralOcrRequest request = new GeneralOcrRequest("", getBitmapFile(mBitmap));

        try {

            String orcResult = imageClient.generalOcr(request);

        } catch (AbstractImageException e) {

            e.printStackTrace();

        }

GeneralOcrRequest的第一个参数是bucketName实际上没什么用（官方说是遗留字段，至少对我来说没什么用，不知道实际上是什么样子），可以直接用空字符填充，第二个参数是File，上面代码是我项目中从bitmap获取file文件的写法。代码中的orcResult即为文字识别结果，返回的是一段json数据，需要自己去转换，推荐使用fastjson框架。

手写体文字识别

1.本项目中使用的是okhttp3框架进行get-post操作，因此是okhttp3框架的代码写法，实际使用因框架的不同而不同，但发送的数据都一样。如果要识别的图片是一个url地址，则用以下的post数据形式：

POST /ocr/handwriting HTTP/1.1

Authorization: 自己生成签名

Host: recognition.image.myqcloud.com

Content-Length: 自定义长度       ps:有使用者称加上这个会报错，本人使用的时候是不加上Content-Length的

Content-Type: application/json

{

  "appid":"你的appid",

  "bucket":"",

  "url":"图片url地址"

}

如果识别本地图片，则使用以下post数据形式（本人就是使用本地图片，因此之后的代码是用这种方式）：

POST /ocr/handwriting HTTP/1.1

Authorization: 自己生成签名

Host: recognition.image.myqcloud.com

Content-Length: 自定义长度                      ps:同上

Content-Type: multipart/form-data;boundary=--------------acebdf13572468

----------------acebdf13572468

Content-Disposition: form-data; name="appid";

你的appid

----------------acebdf13572468

Content-Disposition: form-data; name="bucket";

空串

----------------acebdf13572468

Content-Disposition: form-data; name="image"; filename="test.jpg"

Content-Type: image/jpeg

xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx

----------------acebdf13572468--

上面这些数据让不懂multipart/form-data格式的童鞋来说，看上去就眼花缭乱，不知道该怎么用，但是不要紧，实际上我们根本不需要写这么多东西，这就是使用http框架的好处，它已经帮我们做了很多事。

2.首先需要自己生成签名：

public class Sign {

    /**

     * 生成 Authorization 签名字段

     *

     * @param appId

     * @param secretId

     * @param secretKey

     * @param bucketName

     * @param expired

     * @return

     * @throws Exception

     */

    public static String appSign(long appId, String secretId, String secretKey, String bucketName,

                                 long expired) throws Exception {

        long now = System.currentTimeMillis() / 1000;

        int rdm = Math.abs(new Random().nextInt());

        String plainText = String.format("a=%d&b=%s&k=%s&t=%d&e=%d&r=%d", appId, bucketName,

                secretId, now, now + expired, rdm);

        byte[] hmacDigest = HmacSha1(plainText, secretKey);

        byte[] signContent = new byte[hmacDigest.length + plainText.getBytes().length];

        System.arraycopy(hmacDigest, 0, signContent, 0, hmacDigest.length);

        System.arraycopy(plainText.getBytes(), 0, signContent, hmacDigest.length,

                plainText.getBytes().length);

        return Base64Encode(signContent);

    }

    /**

     * 生成 base64 编码

     *

     * @param binaryData

     * @return

     */

    public static String Base64Encode(byte[] binaryData) {

        String encodedstr = Base64.getEncoder().encodeToString(binaryData);

        return encodedstr;

    }

    /**

     * 生成 hmacsha1 签名

     *

     * @param binaryData

     * @param key

     * @return

     * @throws Exception

     */

    public static byte[] HmacSha1(byte[] binaryData, String key) throws Exception {

        Mac mac = Mac.getInstance("HmacSHA1");

        SecretKeySpec secretKey = new SecretKeySpec(key.getBytes(), "HmacSHA1");

        mac.init(secretKey);

        byte[] HmacSha1Digest = mac.doFinal(binaryData);

        return HmacSha1Digest;

    }

    /**

     * 生成 hmacsha1 签名

     *

     * @param plainText

     * @param key

     * @return

     * @throws Exception

     */

    public static byte[] HmacSha1(String plainText, String key) throws Exception {

        return HmacSha1(plainText.getBytes(), key);

    }

}

上面代码可以直接复制使用，获取签名就是调用appSign这个方法，方法的前四个参数就是之前说的三个值，就不多说了，最后一个参数是时间值，也就是从现在开始，授权多久的时间，单位是秒。获取签名：

  String sign = "";

        try {

            sign = Sign.appSign(APPID, SECRETID, SECRETKEY, "", 2592000);

        } catch (Exception e) {

            e.printStackTrace();

        }

3.请求头和请求体：

        File file = getBitmapFile(mBitmap);

        OkHttpClient okHttpClient = new OkHttpClient();

        RequestBody requestBody = new MultipartBody.Builder()

                .setType(MultipartBody.FORM)

                .addFormDataPart("image", file.getAbsolutePath(), RequestBody.create(MediaType.parse("image/png"), file))

                .addFormDataPart("appid", APPID)

                .build();

        Request request = new Request.Builder()

                .header("host", "recognition.image.myqcloud.com")

                .addHeader("authorization", sign)

                .url("https://recognition.image.myqcloud.com/ocr/handwriting")

                .post(requestBody)

                .build();

重点要注意第一个addFormDataPart方法，第一个参数是“image”无需改动，第二个参数是文件的路径，第三个参数是文件的类型，第四个参数就是file本身。其他的设置项都是默认的，不需要修改。

4.开始post并返回结果：

 okHttpClient.newCall(request).enqueue(new Callback() {

            @Override

            public void onFailure(Call call, IOException e) {

                Log.d("TAG", "onFailure: " + e.getMessage());

            }

            @Override

            public void onResponse(Call call, Response response) throws IOException {

                JSONObject jsonObject=new JSONObject();

                jsonObject= JSON.parseObject(response.body().string());

                Log.i("TAG", "tencent handwrite: " +jsonObject.toString());

            }

        });

返回的结果也是json数据体，需要自己解析。

两种模式相互比较和与百度比较

印刷体模式操作比较简单，毕竟已经封装好了，手写体需要自己post数据比较麻烦。从识别率上，这两种方式都差别不大。在我的测试样例中，百度的高精度印刷体模式识别率是最好的，其次到百度的手写体模式，腾讯的两种识别率都不是很好。

总结

图片识别目前使用百度的sdk准确率比较高。但如果识别的是印刷体，四种都差不多，腾讯印刷体使用最为简单。但这四种都不是很符合本人项目的需要，因此抛弃了光学字符识别，找了另一种方式识别：联机手写识别技术，该方式适合有笔迹过程记录的文字识别（例如输入法的手写输入），下篇文章记录灵云的HWR的使用。

腾讯Ocr文字识别的更多相关文章

云+社区分享——腾讯云OCR文字识别
欢迎大家前往腾讯云+社区,获取更多腾讯海量技术实践干货哦~ 本文由云+社区运营团队发布在腾讯云+社区前言 2018年3月27日腾讯云云+社区联合腾讯云智能图像团队共同在客户群举办了腾讯云OCR文字识 ...
我的AI之路 —— OCR文字识别快速体验版
OCR的全称是Optical Character Recoginition,光学字符识别技术.目前应用于各个领域方向,甚至这些应用就在我们的身边,比如身份证的识别.交通路牌的识别.车牌的自动识别等等. ...
如何精准实现OCR文字识别？
欢迎大家前往腾讯云+社区,获取更多腾讯海量技术实践干货哦~ 本文由云计算基础发表于云+社区专栏前言 2018年3月27日腾讯云云+社区联合腾讯云智能图像团队共同在客户群举办了腾讯云OCR文字识别-- ...
百度Ocr文字识别
简述最近开发一个项目需要用到Ocr文字识别技术来识别手写文字,在评估过程中体验了百度的文字识别和腾讯的文字识别.查找官方开发文档,发现它们都有印刷体和手写体两种符合项目需求的识别模式,但是腾讯的手写 ...
Android OCR文字识别实时扫描手机号（极速扫描单行文本方案）
身份证识别:https://github.com/wenchaosong/OCR_identify 遇到一个需求,要用手机扫描纸质面单,获取面单上的手机号,最后决定用tesseract这个开源OCR库 ...
怎么给OCR文字识别软件重编文档页面号码
ABBYY FineReader Pro for Mac OCR文字识别软件处理文档时,在FineReader文档中,页面的加载顺序即是页面的导入顺序,完成导入之后,文档的所有页面均会被编号,各编号会 ...
对OCR文字识别软件的扫描选项怎么设置
说到OCR文字识别软件,越来越多的人选择使用ABBYY FineReader识别和转换文档,然而并不是每个人都知道转换质量取决于源图像的质量和所选的扫描选项,今天就给大家普及一下这方面的知识. ABB ...
怎么提高OCR文字识别软件的识别正确率
在OCR文字识别软件当中,ABBYY FineReader是比较好用的程序之一,但再好的识别软件也不能保证100%的识别正确率,用户都喜欢软件的正确率高一些,以减轻识别后修正的负担,很多用户也都提过这 ...
OCR文字识别软件许可文件被误删了怎么办
使用任何一款软件,都会有误操作的情况发生,比如清理文件时一不小心删除了许可文件,对于ABBYY FineReader 12这样一款OCR文字识别软件,因失误错误删除了许可文件该怎么办呢?今天就来给大家 ...

随机推荐

解决 ORA-27102: out of memory
记一次故障处理总结: 操作系统:windows server 2008 R2数据库版本:11.2.0.2 故障描述:外部应用连接数据库,提示连接不正常: 排错过程:1.首先检查数据库监听服务状态是否 ...
没啥事用C语言写一个Trie tree玩玩，支持中英文，用g++编译通过
#include <cstdio> #include <cstdlib> #include <vector> #define ALPHABETS 2600000 # ...
Zookeeper配置文件中的配置项解释和Zookeeper的安装
zookeeper的默认配置文件为zookeeper/conf/zoo_sample.cfg,需要将其修改为zoo.cfg.其中各配置项的含义,解释如下: 1.tickTime:CS通信心跳时间Zoo ...
工具-CrashMonkey4IOS，Monkey测试方案
在TesterHome看到了CrashMonkey4IOS,顿时觉得之前用instrument在做monkey测试,非常的弱智!crash后啥都看不到,无crashlog,无crash步骤,并且也不能 ...
全网最详细的CentOS7里如何安装MySQL（得改为替换安装MariaDB）（图文详解）
不多说,直接上干货! 直接yum install mysql的话会报错,原因在于yum安装库里没有直接可以用的安装包,此时需要用到MariaDB了,MariaDB是MySQL社区开发的分支,也是一个增 ...
让 markdown 生成带目录的 html 文件
安装 npm install -g i5ting_toc 用法进入 markdown 文件所在的文件夹举个栗子: 你的sample.md文件放在桌面上 cd /Users/dora/Desktop ...
Eclipse 处理 Console 打印信息自动删除
开发中,特识是需要项目运行打印日志很长的时候需要查看打印的日志, Eclipse没经过设定的话,会自动80000行之前的日志记录. 想要日志一直打印下去处理方法: Preferences --> ...
【SpringBoot系列3】SpringBoot使用事务和AOP
前言: 因为SpringBoot操作两者实在太简单了,我就放一起来写了. 正文(事务): /** * springboot中运用事务 * 真的超级方便,直接加上注解就ok了,连配置都省了 * @ret ...
微信小程序开源Demo精选
来自:http://www.jianshu.com/p/0ecf5aba79e1 文/weapphome(简书作者)原文链接:http://www.jianshu.com/p/0ecf5aba79e1 ...
SQL脚本修改数据库名称
USE master; GO DECLARE @SQL VARCHAR(MAX); SET @SQL='' SELECT @SQL=@SQL+'; KILL '+RTRIM(SPID) FROM ma ...

腾讯Ocr文字识别

简述

通用文字识别

手写体文字识别

两种模式相互比较和与百度比较

总结

腾讯Ocr文字识别的更多相关文章

随机推荐

热门专题