简述

上篇文章记录了百度Ocr的两种模式用法,接下来这篇文章开始记录腾讯Ocr的使用方法。腾讯Ocr的通用印刷体识别模式使用比较简单,直接接入sdk即可,但手写体的识别相对比较麻烦,需要自己post表单(也可能是能用sdk的,但我是没有找到)

通用文字识别

1.直接在Android Studio的app->build.gradle->dependencies中添加:

 implementation 'com.qcloud:qcloud-image-sdk:2.3.6'

2.初始化识别程序:

ImageClient imageClient = new ImageClient(APPID, SecretId, SecretKey,
ImageClient.NEW_DOMAIN_recognition_image_myqcloud_com);

其中APPID、SecretId、SecretKey这些和百度一样是需要去注册获取的,具体获取方式没什么难度就不详说(点击前往腾讯AI开放平台)。最后一个参数是服务器域名,默认使用新域名,也就是:

ImageClient.NEW_DOMAIN_recognition_image_myqcloud_com

如果是老用户,修改为以下域名:

ImageClient.OLD_DOMAIN_service_image_myqcloud_com

3.开始进行文字识别:

  GeneralOcrRequest request = new GeneralOcrRequest("", getBitmapFile(mBitmap));
try {
String orcResult = imageClient.generalOcr(request);
} catch (AbstractImageException e) {
e.printStackTrace();
}

GeneralOcrRequest的第一个参数是bucketName实际上没什么用(官方说是遗留字段,至少对我来说没什么用,不知道实际上是什么样子),可以直接用空字符填充,第二个参数是File,上面代码是我项目中从bitmap获取file文件的写法。代码中的orcResult即为文字识别结果,返回的是一段json数据,需要自己去转换,推荐使用fastjson框架。

手写体文字识别

1.本项目中使用的是okhttp3框架进行get-post操作,因此是okhttp3框架的代码写法,实际使用因框架的不同而不同,但发送的数据都一样。如果要识别的图片是一个url地址,则用以下的post数据形式:

POST /ocr/handwriting HTTP/1.1
Authorization: 自己生成签名
Host: recognition.image.myqcloud.com
Content-Length: 自定义长度 ps:有使用者称加上这个会报错,本人使用的时候是不加上Content-Length的
Content-Type: application/json
{
"appid":"你的appid",
"bucket":"",
"url":"图片url地址"
}

如果识别本地图片,则使用以下post数据形式(本人就是使用本地图片,因此之后的代码是用这种方式):

POST /ocr/handwriting HTTP/1.1
Authorization: 自己生成签名
Host: recognition.image.myqcloud.com
Content-Length: 自定义长度 ps:同上
Content-Type: multipart/form-data;boundary=--------------acebdf13572468 ----------------acebdf13572468
Content-Disposition: form-data; name="appid"; 你的appid
----------------acebdf13572468
Content-Disposition: form-data; name="bucket"; 空串
----------------acebdf13572468
Content-Disposition: form-data; name="image"; filename="test.jpg"
Content-Type: image/jpeg xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
----------------acebdf13572468--

上面这些数据让不懂multipart/form-data格式的童鞋来说,看上去就眼花缭乱,不知道该怎么用,但是不要紧,实际上我们根本不需要写这么多东西,这就是使用http框架的好处,它已经帮我们做了很多事。

2.首先需要自己生成签名:

public class Sign {
/**
* 生成 Authorization 签名字段
*
* @param appId
* @param secretId
* @param secretKey
* @param bucketName
* @param expired
* @return
* @throws Exception
*/
public static String appSign(long appId, String secretId, String secretKey, String bucketName,
long expired) throws Exception {
long now = System.currentTimeMillis() / 1000;
int rdm = Math.abs(new Random().nextInt());
String plainText = String.format("a=%d&b=%s&k=%s&t=%d&e=%d&r=%d", appId, bucketName,
secretId, now, now + expired, rdm);
byte[] hmacDigest = HmacSha1(plainText, secretKey);
byte[] signContent = new byte[hmacDigest.length + plainText.getBytes().length];
System.arraycopy(hmacDigest, 0, signContent, 0, hmacDigest.length);
System.arraycopy(plainText.getBytes(), 0, signContent, hmacDigest.length,
plainText.getBytes().length);
return Base64Encode(signContent);
} /**
* 生成 base64 编码
*
* @param binaryData
* @return
*/
public static String Base64Encode(byte[] binaryData) {
String encodedstr = Base64.getEncoder().encodeToString(binaryData);
return encodedstr;
} /**
* 生成 hmacsha1 签名
*
* @param binaryData
* @param key
* @return
* @throws Exception
*/
public static byte[] HmacSha1(byte[] binaryData, String key) throws Exception {
Mac mac = Mac.getInstance("HmacSHA1");
SecretKeySpec secretKey = new SecretKeySpec(key.getBytes(), "HmacSHA1");
mac.init(secretKey);
byte[] HmacSha1Digest = mac.doFinal(binaryData);
return HmacSha1Digest;
} /**
* 生成 hmacsha1 签名
*
* @param plainText
* @param key
* @return
* @throws Exception
*/
public static byte[] HmacSha1(String plainText, String key) throws Exception {
return HmacSha1(plainText.getBytes(), key);
}
}

上面代码可以直接复制使用,获取签名就是调用appSign这个方法,方法的前四个参数就是之前说的三个值,就不多说了,最后一个参数是时间值,也就是从现在开始,授权多久的时间,单位是秒。获取签名:

  String sign = "";
try {
sign = Sign.appSign(APPID, SECRETID, SECRETKEY, "", 2592000);
} catch (Exception e) {
e.printStackTrace();
}

3.请求头和请求体:

        File file = getBitmapFile(mBitmap);
OkHttpClient okHttpClient = new OkHttpClient();
RequestBody requestBody = new MultipartBody.Builder()
.setType(MultipartBody.FORM)
.addFormDataPart("image", file.getAbsolutePath(), RequestBody.create(MediaType.parse("image/png"), file))
.addFormDataPart("appid", APPID)
.build();
Request request = new Request.Builder()
.header("host", "recognition.image.myqcloud.com")
.addHeader("authorization", sign)
.url("https://recognition.image.myqcloud.com/ocr/handwriting")
.post(requestBody)
.build();

重点要注意第一个addFormDataPart方法,第一个参数是“image”无需改动,第二个参数是文件的路径,第三个参数是文件的类型,第四个参数就是file本身。其他的设置项都是默认的,不需要修改。

4.开始post并返回结果:

 okHttpClient.newCall(request).enqueue(new Callback() {
@Override
public void onFailure(Call call, IOException e) {
Log.d("TAG", "onFailure: " + e.getMessage());
} @Override
public void onResponse(Call call, Response response) throws IOException {
JSONObject jsonObject=new JSONObject();
jsonObject= JSON.parseObject(response.body().string());
Log.i("TAG", "tencent handwrite: " +jsonObject.toString());
}
});

返回的结果也是json数据体,需要自己解析。

两种模式相互比较和与百度比较

印刷体模式操作比较简单,毕竟已经封装好了,手写体需要自己post数据比较麻烦。从识别率上,这两种方式都差别不大。在我的测试样例中,百度的高精度印刷体模式识别率是最好的,其次到百度的手写体模式,腾讯的两种识别率都不是很好。

总结

图片识别目前使用百度的sdk准确率比较高。但如果识别的是印刷体,四种都差不多,腾讯印刷体使用最为简单。但这四种都不是很符合本人项目的需要,因此抛弃了光学字符识别,找了另一种方式识别:联机手写识别技术,该方式适合有笔迹过程记录的文字识别(例如输入法的手写输入),下篇文章记录灵云的HWR的使用。

腾讯Ocr文字识别的更多相关文章

  1. 云+社区分享——腾讯云OCR文字识别

    欢迎大家前往腾讯云+社区,获取更多腾讯海量技术实践干货哦~ 本文由云+社区运营团队发布在腾讯云+社区 前言 2018年3月27日腾讯云云+社区联合腾讯云智能图像团队共同在客户群举办了腾讯云OCR文字识 ...

  2. 我的AI之路 —— OCR文字识别快速体验版

    OCR的全称是Optical Character Recoginition,光学字符识别技术.目前应用于各个领域方向,甚至这些应用就在我们的身边,比如身份证的识别.交通路牌的识别.车牌的自动识别等等. ...

  3. 如何精准实现OCR文字识别?

    欢迎大家前往腾讯云+社区,获取更多腾讯海量技术实践干货哦~ 本文由云计算基础发表于云+社区专栏 前言 2018年3月27日腾讯云云+社区联合腾讯云智能图像团队共同在客户群举办了腾讯云OCR文字识别-- ...

  4. 百度Ocr文字识别

    简述 最近开发一个项目需要用到Ocr文字识别技术来识别手写文字,在评估过程中体验了百度的文字识别和腾讯的文字识别.查找官方开发文档,发现它们都有印刷体和手写体两种符合项目需求的识别模式,但是腾讯的手写 ...

  5. Android OCR文字识别 实时扫描手机号(极速扫描单行文本方案)

    身份证识别:https://github.com/wenchaosong/OCR_identify 遇到一个需求,要用手机扫描纸质面单,获取面单上的手机号,最后决定用tesseract这个开源OCR库 ...

  6. 怎么给OCR文字识别软件重编文档页面号码

    ABBYY FineReader Pro for Mac OCR文字识别软件处理文档时,在FineReader文档中,页面的加载顺序即是页面的导入顺序,完成导入之后,文档的所有页面均会被编号,各编号会 ...

  7. 对OCR文字识别软件的扫描选项怎么设置

    说到OCR文字识别软件,越来越多的人选择使用ABBYY FineReader识别和转换文档,然而并不是每个人都知道转换质量取决于源图像的质量和所选的扫描选项,今天就给大家普及一下这方面的知识. ABB ...

  8. 怎么提高OCR文字识别软件的识别正确率

    在OCR文字识别软件当中,ABBYY FineReader是比较好用的程序之一,但再好的识别软件也不能保证100%的识别正确率,用户都喜欢软件的正确率高一些,以减轻识别后修正的负担,很多用户也都提过这 ...

  9. OCR文字识别软件许可文件被误删了怎么办

    使用任何一款软件,都会有误操作的情况发生,比如清理文件时一不小心删除了许可文件,对于ABBYY FineReader 12这样一款OCR文字识别软件,因失误错误删除了许可文件该怎么办呢?今天就来给大家 ...

随机推荐

  1. ASM路径问题导致数据库不能正常启动 -- 报:ORA-03113: end-of-file on communication channel

    环境描述: 操作系统版本:Red Hat Enterprise Linux Server release 6.5 (Santiago) 数据库版本:Oracle 11.2.0.4 RAC 场景描述: ...

  2. (转)Python 日志处理(三) 日志状态码分析、浏览器分析

    原文:https://www.cnblogs.com/i-honey/p/7791564.html 在企业中,从日志中提取数据进行分析,可以帮助企业更加了解用户行为,用户最感兴趣的产品或者内容,分析得 ...

  3. (转)Python自动化运维之13、异常处理及反射(__import__,getattr,hasattr,setattr)

    原文:http://www.cnblogs.com/xiaozhiqi/p/5778856.html https://blog.csdn.net/zong596568821xp/article/det ...

  4. 【从0到1学javascript】javascript数据结构----数组

    javascript中对数组的定义 数组是一种特殊的对象,用来表示偏移量的索引是该对象的属性,索引可以是整数.这些数字索引在内部被转换成字符串类型.这是因为javascript对象中的属性名必须是字符 ...

  5. JAVA面试精选【Java基础第三部分】

    上一篇,我们给出了大概35个题目,都是基础知识,有童鞋反映题目过时了,其实不然,这些是基础中的基础,但是也是必不可少的,面试题目中还是有一些基础题目的,我们本着先易后难的原则,逐渐给出不同级别的题目, ...

  6. Hadoop2源码分析-RPC机制初识

    1.概述 上一篇博客,讲述Hadoop V2的序列化机制,这为我们学习Hadoop V2的RPC机制奠定了基础.RPC的内容涵盖的信息有点多,包含Hadoop的序列化机制,RPC,代理,NIO等.若对 ...

  7. IntelliJ中的main函数、for循环、System.out.println()快捷键

    main函数 输入: psvm 回车 输出: public static void main(String[] args) { } for循环 输入:fori 回车 输出: for (int i = ...

  8. JavaScript时间操作工具类

    /** * 时间操作工具类 * * @author zwq * */ var TimeFrameUtil = { /** * 格式化日期 * @param date {Date} 日期 * @para ...

  9. Docker环境下搭建DNS LVS(keepAlived) OpenResty服务器简易集群

    现在上网已经成为每个人必备的技能,打开浏览器,输入网址,回车,简单的几步就能浏览到漂亮的网页,那从请求发出到返回漂亮的页面是怎么做到的呢,我将从公司中一般的分层架构角度考虑搭建一个简易集群来实现.目标 ...

  10. vue实用组件——页面公共头部

    可伸缩自适应的页面头部,屏幕适应范围更广泛 效果如下: 代码如下: <template> <div class="site-header"> <div ...