python3 图片文字识别

　　最近用到了图片文字识别这个功能，从网上搜查了一下，决定利用百度的文字识别接口。通过测试发现文字识别率还可以。下面就测试过程简要说明一下

　　1、注册用户

　　　链接：https://login.bce.baidu.com/?account=

　　　少量使用，免费

　　2、创建一个应用

　　3、调用方式

　　　python SDK文档：https://cloud.baidu.com/doc/OCR/OCR-Python-SDK.html#.E9.80.9A.E7.94.A8.E6.96.87.E5.AD.97.E8.AF.86.E5.88.AB

　　　首先安装　　pip install baidu-aip

　　　快速入门：https://cloud.baidu.com/doc/OCR/OCR-Python-SDK.html#.E5.BF.AB.E9.80.9F.E5.85.A5.E9.97.A8

　　　接口说明：https://cloud.baidu.com/doc/OCR/OCR-Python-SDK.html#.E6.8E.A5.E5.8F.A3.E8.AF.B4.E6.98.8E

　　　具体实现代码：

from aip import AipOcr

class baiduApi:

    def __init__(self,APP_ID,API_KEY,SECRET_KEY):

        '''

        """ 你的 APPID AK SK """

        APP_ID = '你的 App ID'

        API_KEY = '你的 Api Key'

        SECRET_KEY = '你的 Secret Key'

        '''

        self.client = AipOcr(APP_ID, API_KEY, SECRET_KEY)

    """ 读取图片 """

    def get_file_content(self,imageFile):

        with open(imageFile, 'rb') as fp:

            return fp.read()

    def getWordFromImage(self,imageFile):

        image = self.get_file_content(imageFile)

        result = self.client.basicGeneral(image)

        print(result)

if __name__=="__main__":

    APP_ID=''

    API_KEY='eT4rkU2i2X2quti4Z5kIl8dT'

    SECRET_KEY='UCo2WIQoMq12TR98Nm2N1PgfhWT47'

    obj = baiduApi(APP_ID,API_KEY,SECRET_KEY)

    imageFile='E:\\test5.png'

    obj.getWordFromImage(imageFile)

　　另外一种调用方式

　　参考：https://cloud.baidu.com/doc/OCR/OCR-API.html#.E8.B0.83.E7.94.A8.E6.96.B9.E5.BC.8F.E4.BA.8C

　　【如果您对于使用API调用的方式很陌生，您可以参见：【只要10分钟快速掌握文字识别】教程

　　可以利用调用方式一

　　首先获取access_token: 必须参数，参考“Access Token获取”。

　　注意：access_token的有效期为30天，需要每30天进行定期更换；

　　获取后access_token，例如文字识别API，使用HTTPS POST发送：

https://aip.baidubce.com/rest/2.0/ocr/v1/general?access_token=24.f9ba9c5241b67688bb4adbed8bc91dec.2592000.1485570332.282335-8574074

import requests

import json

import base64

import os

class baiduApi:

    def __init__(self):

        pass

    def getAccess_Token(self,ApiKey='aTdOkc2i4X2qutd4Z5kIl8dT',SecretKey='UCodWIQgMq1NZTRdNmMNduN1PgfhWT47'):

        url='https://aip.baidubce.com/oauth/2.0/token?grant_type=client_credentials&client_id=%s&client_secret=%s'%(ApiKey,SecretKey)

        txt = requests.get(url).text

        dict1 = eval(txt)

        access_token = dict1.get('access_token')

        print(access_token)

        return access_token

        # txt ={"refresh_token":"25.0dc809836ad8546c79547ec12b4bf9d7.315360000.1869465297.282335-15907896","expires_in":2592000,

        #  "session_key":"9mzdWESprZJdkHm0iQOcHGX2Rn2qTwQ6Q9NIKPHwTu\/DC9HqDzZzo8JJRfsE4q5OnATglorWcPy9WRFLKlrptCbdDx\/Dug==",

        #  "access_token":"24.c4bab673c3edbe30eb334df37d4cf434.2592000.1556697297.282335-15907896"}

        #

        # access_token = txt.get('access_token')

        # print(access_token)

    def getdata(self,imageFile,access_token):

        imageBase64 = None

        if os.path.exists(imageFile):

            with open(imageFile, 'rb') as f:  # 以二进制读取图片

                data = f.read()

                imageBase64= base64.b64encode(data).decode()

        if imageBase64:

            data1 = {'image_type': 'BASE64',

                     'image': imageBase64,

                     'group_id': 'group001',

                     'user_id': 'D001'}

            headers = {'Content-type': 'application/x-www-form-urlencoded'}

            url = 'https://aip.baidubce.com/rest/2.0/ocr/v1/general?access_token=%s' % access_token

            # post调用方式

            response = requests.post(url, data=data1, headers=headers)

            dict1 = json.loads(response.text)

            # print(dict1)

            words_result = dict1.get('words_result')

            word = ''

            for wd in words_result:

                word = wd.get('words')

                print(word)

                # print(wd.get('words'))

            # return word

python3 图片文字识别的更多相关文章

Python人工智能之图片识别，Python3一行代码实现图片文字识别
1.Python人工智能之图片识别,Python3一行代码实现图片文字识别 2.tesseract-ocr安装包和中文语言包注意:
小试Office OneNote 2010的图片文字识别功能（OCR）
原文:小试Office OneNote 2010的图片文字识别功能(OCR) 自Office 2003以来,OneNote就成为了我电脑中必不可少的软件,它集各种创新功能于一身,可方便的记录下各种类型 ...
一篇文章搞定百度OCR图片文字识别API
一篇文章搞定百度OCR图片文字识别API https://www.jianshu.com/p/7905d3b12104
刚破了潘金莲的身份信息（图片文字识别），win7、win10实测可用(免费下载)
刚破了潘金莲的身份信息(图片文字识别),win7.win10实测可用效果如下: 证照,车牌.身份证.名片.营业执照等图片文字均可识别电脑版本人出品大小1.3MB 下载地址:https://p ...
【图片识别】java 图片文字识别 ocr （转）
http://www.cnblogs.com/inkflower/p/6642264.html 最近在开发的时候需要识别图片中的一些文字,网上找了相关资料之后,发现google有一个离线的工具,以下为 ...
【原】Coursera—Andrew Ng机器学习—课程笔记 Lecture 18—Photo OCR 应用实例:图片文字识别
Lecture 18—Photo OCR 应用实例:图片文字识别 18.1 问题描述和流程图 Problem Description and Pipeline 图像文字识别需要如下步骤: 1.文字侦测 ...
java 图片文字识别 ocr
最近在开发的时候需要识别图片中的一些文字,网上找了相关资料之后,发现google有一个离线的工具,以下为java使用的demo 在此之前,使用这个工具需要在本地安装OCR工具: 下面一个是一定要安装的 ...
JAVA的图片文字识别技术
从2013年的记录看,JAVA中图片文字识别技术大部分采用ORC的tesseract的软件功能,后来渐渐开放了java-api调用接口. 图片文字识别技术,还是采用训练的方法.并未从根本上解决图片与文 ...
[C13] 应用实例：图片文字识别(Application Example: Photo OCR)
应用实例:图片文字识别(Application Example: Photo OCR) 问题描述和流程图(Problem Description and Pipeline) 图像文字识别应用所作的事是 ...

随机推荐

普林斯顿微积分读本大纲与重点（by zzd）
普林斯顿微积分读本大纲重点由于博客园太菜,所以我用图片上传. 当前更新状态:未完待续,挖坑暂时不填了. UPD(2018-07-08): 稍微更一下,加一个本书的某一版本下载链接:https:// ...
Redis Pubsub命令用法
一.什么是pub/sub及实现Pub/Sub功能(means Publish, Subscribe)即发布及订阅功能. Redis通过publish和subscribe命令实现订阅和发布的功能. 订阅 ...
Python 获取计算机全名（fully qualified host name）
Python 获取计算机全名(fully qualified host name) import socket socket.getfqdn() socket.gethostname()
fastadmin默认的controller已实现的方法
fastadmin控制器 <?php namespace app\admin\controller\peizi; use app\common\controller\Backend; /** * ...
解决Ubuntu中Unable to acquire the dpkg frontend lock (/var/lib/dpkg/lock-frontend), is another proce...
解决Ubuntu中Unable to acquire the dpkg frontend lock (/var/lib/dpkg/lock-frontend), is another proce... ...
Tree Reconstruction Gym - 101911G（构造）
---恢复内容开始--- Monocarp has drawn a tree (an undirected connected acyclic graph) and then has given ea ...
xss小结-从xss平台搭建到csp规则
0x00前言 xss是跨站脚本攻击,利用嵌入js代码达到‘控制’对方浏览器的作用,测试的时候我们是用alert(1)弹窗,而做CTF也好,实际中的漏洞利用也好一般是用xss获取管理员的cookie 0 ...
Oracle date 详解
oracle 数据类型详解---日期型 oracle数据类型看起来非常简单,但用起来会发现有许多知识点,本文是我对ORACLE日期数据类型的一些整理,都是开发入门资料,与大家分享:注:由于INTERV ...
jsonp 跨域 jsonp 发音
JSONP(JSON with Padding)是JSON的一种“使用模式” 可用于解决主流浏览器的跨域数据访问的问题. 由于同源策略, 一般来说位于 server1.example.com 的网页 ...
洛谷P3375 [模板]KMP字符串匹配
To 洛谷.3375 KMP字符串匹配题目描述如题,给出两个字符串s1和s2,其中s2为s1的子串,求出s2在s1中所有出现的位置. 为了减少骗分的情况,接下来还要输出子串的前缀数组next.如果 ...

python3 图片文字识别

python3 图片文字识别的更多相关文章

随机推荐

热门专题