python基于万象优图识别图片中的中文

最近一直在研究光学字符识别，即OCR。最开始在谷爹那里了解到了开源的Tesseract，可以拿来识别简单的英文和数字。但是识别中文的准确率并不高。

然后从Tesseract到Tesseract.js，经过多次尝试研究，最后发现腾讯爹的万象优图识别率是最高的。趁现在是公测免费期，赶紧尝试了一把。

下面来说一说我是怎么用python实现中文识别的。

首先百度万象优图登录吧，腾讯的。。。你们懂得。。。。进去后，创建一个bucket，然后可以选择上传图片

这些准备工作做好以后，就开始写代码吧

首先如果是识别身份证，名片，标签等图片的话，强烈建议直接使用万象优图提供python sdk，详情请见https://cloud.tencent.com/document/product/460/7991

我们这里，是做图片通用印刷体识别，所以就只有被迫用万象优图提供的API：（原本我是更喜欢用SDK的，因为简单，但是目前SDK不支持）

万象优图OCR接口采用http协议，支持指定图片URL和上传本地图片文件两种方式。

根据用户提供的图片，返回识别出的字段信息。

接口：http://recognition.image.myqcloud.com/ocr/general

这里有三点需要注意：

(1) 每个请求的包体大小限制为6MB。

(2) 所有接口都为POST方法。

(3) 不支持 .gif这类的多帧动图。

然后我用可以使用requests模块来发http请求。

这里最麻烦的就是要定制请求头，不然腾讯云是解析不到的，笔者才疏学浅在这里研究了一下午才正确定制出了请求头。。。。

先来看看请求头的规则：

参数名	值	描述
Host	recognition.image.myqcloud.com	服务器域名
Content-Length	包体总长度	整个请求包体内容的总长度，单位：字节（Byte）
Content-Type	Application/json或者Multipart/form-data	根据不同接口选择
Authorization	鉴权签名	用于鉴权的签名，使用多次有效签名。详情

这里的难点就是这个鉴权签名，直接点击表格里面的详情去看吧，我这里不做复制粘贴。

关于请求参数：

使用image则使用 multipart/form-data格式

不使用image则使用 application/json格式

参数名	是否必须	类型	参数说明
appid	必须	string	项目ID
bucket	必须	string	空间名称
image	可选	binary	图片内容
url	可选	string	图片的url,image和url只提供一个即可，如果都提供，只使用url

好了，现在开始正式开始吧

先写一下请求头涉及到的变量

然后依次把他们拼接起来

我这里采用的是单次

然后再根据要求进行 HMAC-SHA1加密

这里强调一下，官方的说法是

根据我的研究，转换出来的不是二进制，然后我还特意去转成了二进制。。。。。。发现其实根本不用，转出来的在pycharm里面是个乱码，可以直接用的

最后，加密的数据和之前的拼接数据再拼在一起做base64转码

这样签名就完成了，后面的基本不难，主要就是签名这里有坑，下面直接上代码：

# coding=utf-8

# /usr/bin/python

# coding=utf-8

# create by 15025463191 2017/10/11

import requests

import hmac

import hashlib

import base64

import time

import random

import re

appid = ""

bucket = "imgregnise"

secret_id = "AKIDZx72kFVBPRF4324234234o8C1auynPezyl"  #我更改了，不要复制我的

secret_key = "h9NUN1RbZIm11mJbUt2v32432Zx"  #我更改了，不要复制我的

expired = time.time() + 2592000

onceExpired = 0

current = time.time()

rdm = ''.join(random.choice("") for i in range(10))

userid = ""

fileid = "tencentyunSignTest"

info = "a=" + appid + "&b=" + bucket + "&k=" + secret_id + "&e=" + str(expired) + "&t=" + str(current) + "&r=" + str(

    rdm) + "&u=0&f="

signindex = hmac.new(secret_key, info, hashlib.sha1).digest()  # HMAC-SHA1加密

sign = base64.b64encode(signindex + info)  # base64转码

url = "http://recognition.image.myqcloud.com/ocr/general"

headers = {'Host': 'recognition.image.myqcloud.com',

           "Content-Length": "",

           "Content-Type": "application/json",

           "Authorization": sign

           }

payload = {

    "appid": appid,

    "bucket": bucket,

    "url": "http://imgregnise-1254602529.picsh.myqcloud.com/123456.png"

}

r = requests.post(url, json=payload, headers=headers)

responseinfo = r.content

r_index = r'itemstring":"(.*?)"'  # 做一个正则匹配

result = re.findall(r_index, responseinfo)

for i in result:

    print i

我这里用图片试验了一次，准备率还是很高的，就是中间少了一个“餐。”

但是这样的识别率已经是很高了

最后预祝各种识别成功！

python基于万象优图识别图片中的中文的更多相关文章

腾讯云万象优图每个账户提供50G的图片存储（支持黄图检测）
文章由GIT博客迁移过来程序下载地址(源码也在):点我下载设计说明 10月20号晚上,准备写这么一个程序. 腾讯云万象优图每个账户提供50G的图片存储(支持黄图检测) 可以在截图之后,直接点击上传 ...
ThinkPHP集成万象优图
项目原因不告诉你,反正需要把腾讯云的万象优图整合进来. 下载PHP版的万象优图的SDK 下载地址:https://github.com/tencentyun/image-php-sdk git cl ...
Ueditor编辑器图片上传到万象优图
最近想用typecho做一个个人博客站,typecho的文本编辑器不能上传图片,我就用Ueditor替换的了原来的文本编辑器,听说腾讯的万象优图每月有50G的免费空间和流量,我就自己改了下Uedito ...
使用Python基于OpenCV的验证码识别
Blog:https://blog.csdn.net/qq_40962368/article/details/89312429(Verification_Code_Identification) 步骤 ...
python实战===用python识别图片中的中文
需要安装的模块 PIL pytesseract 需要下载的工具: http://download.csdn.net/download/bo_mask/10196285 因为之前百度云的链接总失效,所以 ...
python基于OpenCV的人脸识别系统
想获得所有的代码,请下载(来自我的CSDN): https://download.csdn.net/download/qq_40875849/11292912 主函数: from recognitio ...
mac 使用tesseract识别图片中的中文
安装 tesseractbrew install tesseract 加入环境变量export TESSDATA_PREFIX=/usr/local/Cellar/tesseract/4.1.0/sh ...
基于CentOS体验万象优图鉴黄服务
系统要求:CentOS 7.2 64 位操作系统初始化配置使用万象优图图片鉴黄 API 接口,我们需要先完成以下步骤: 获取腾讯云账号 APP ID 配置云 API 公钥/密钥配置优图 buck ...
在腾讯云上把Laravel整合万向优图图片管理能力，打造高效图片处理服务
推荐理由: 现如今数据爆炸性增长,人类生活产出的数据越来越多,文字信息,图片信息,视频信息:但有很多信息我们都无法直接使用,需通过一定的处理,才能够获取其中对我们有用的信息,在腾讯云上的万向优图能够对 ...

随机推荐

201521123118《java程序与设计》第七次作业
1. 本周学习总结以你喜欢的方式(思维导图或其他)归纳总结集合相关内容. 2. 书面作业 1. ArrayList代码分析 1.1 解释ArrayList的contains源代码 public bo ...
201521123075 《Java程序设计》第1周学习总结
1. 本周学习总结 (1)Java不仅是程序语言,还是一种标准规范,代表着解决问题的方案.Java是一个面向对象的编程语言,熟悉后相对于c++更方便,其一大特色就是能够跨平台运行. (2)Java发展 ...
201521123022 《Java程序设计》第十周学习总结
1. 本周学习总结 1.1 以你喜欢的方式(思维导图或其他)归纳总结异常与多线程相关内容. 2. 书面作业本次PTA作业题集异常.多线程 Q1.finally 题目4-2 Q1.1 截图你的提交结果 ...
201521123078 《Java程序设计》第12周学习总结
1. 本周学习总结 1.1 以你喜欢的方式(思维导图或其他)归纳总结多流与文件相关内容. 2. 书面作业将Student对象(属性:int id, String name,int age,doubl ...
201521123014《Java程序设计》第13周学习总结
1. 本周学习总结思维导图: 2. 书面作业 Q1. 网络基础 1.1 比较ping www.baidu.com与ping cec.jmu.edu.cn,分析返回结果有何不同?为什么会有这样的不同? ...
linux 环境NTP配置与开机自启动（转）
Linux下配置NTP服务器一.前言: 默认NTP服务端口: UDP/123 本文配置的NTP工作模式: 使用client/server方式,该方式适用于一台时间服务器接收上层 ...
mapreduce新旧api对比
对比:hadoop版本1.x 新版,hadoop版本0.x 旧版 1.新api引用包一般是mapreduce ,旧版api引用的包一般是mapred 2.新api使用Job,旧版api使用JobCon ...
[cocos2dx] lua注册回调到c++
思路像所有语言一样,绑定回调主要是执行的任务执行到特定情形的时候,调用对用回调方法. 这里也一样.核心思路是,当c代码执行到特定特定情形的时候,调用lua的方法我这里使用的是用lua_stack直 ...
[UIKit学习]01.关于UIView，frame，bounds，center
UIView是Cocoa大多控件的父类,本身不带事件. UIView的常见用法 @property(nonatomic,readonly) UIView *superview; 获得自己的父控件对象 ...
Flex布局介绍
Flex 是 Flexible Box 的缩写,意为"弹性布局",用来为盒状模型提供最大的灵活性任何一个容器都可以指定为 Flex 布局. .box{ display: -web ...

python基于万象优图识别图片中的中文

python基于万象优图识别图片中的中文的更多相关文章

随机推荐

热门专题