Python通过百度Ai识别图片中的文字

版本：python3.7

工作中有需要识别图片中的汉字，查看了半天大神们的博客，但没找到完全可以用的源码，经过自己的实践，以下源码可以实现：

创建应用
首先你需要登录百度AI,选择文字识别，创建一个应用，会生成应用名称、AppID、API Key、Secret Key 这些东西，下面我们代码是需要用到APP_ID、API_Key 和 Secret_Key ，然后安装百度的包：baidu-aip

图片我个人保存在了filePath 路径里，当然这个图片也可以是从其他地方读取。

如果正则表达式不太会，可以参考：http://www.cnblogs.com/wenmaoyu/archive/2011/07/21/2113124.html

# -*- coding: UTF-8 -*-
from aip import AipOcr
import  re

# 定义常量
APP_ID = '***'           # 百度生成的
API_KEY = '***'
SECRET_KEY = 'g7grgiXHKf9Rbv1u7frxyOsh39mdayYs'

# 初始化AipFace对象
aipOcr = AipOcr(APP_ID, API_KEY, SECRET_KEY)

# 读取图片
filePath = "D:\QQ129.png"

def get_file_content(filePath):
    with open(filePath, 'rb') as fp:
        return fp.read()

# 定义参数变量
options = {
    'detect_direction': 'true',
    'language_type': 'CHN_ENG',
}

# 调用通用文字识别接口
result = aipOcr.basicAccurate(get_file_content(filePath), options)    #basicAccurate是高精度版，识别率高， basicGeneral是普通识别版

print(result)

world=re.findall(r'[\u4e00-\u9fa5]',str(result))          #通过正则表达式识别汉字
print(world)
for each in world:
    print(each)

Python通过百度Ai识别图片中的文字的更多相关文章

什么？小程序实时语音识别你还在痛苦的对接科大讯飞？百度Ai识别？
前言微信小程序,说不上大火,但是需求还是不少的.各大企业都想插一足于是前端同学就有事情做了. 需求我需要录音我边说话边识别,我要同声传译,我要文字转语音,还要萝莉音我:??? 正文一开始, ...
小白学Python——用百度AI 实现 OCR 文字识别
百度AI功能还是很强大的,百度AI开放平台真的是测试接口的天堂,免费接口很多,当然有量的限制,但个人使用是完全够用的,什么人脸识别.MQTT服务器.语音识别等等,应有尽有. 看看OCR识别免费的量快 ...
python基于百度AI开发文字识别
很多场景都会用到文字识别,比如app或者网站里都会上传身份证等证件以及财务系统识别报销证件等等第一步,你需要去百度AI里去注册一个账号,然后新建一个文字识别的应用然后你将得到一个API Key 和 ...
使用Python进行OCR -- 识别图片中的文字
工具 Tesseract pytesseract tesserocr 朋友需要一个工具,将图片中的文字提取出来.我帮他在网上找了一些OCR的应用,都不好用.所以准备自己研究,写一个Web APP供他使 ...
Python识别图片中的文字
1 import os,glob 2 def photo_compression(original_imgage,tmp_image_path): 3 '''图片备份.压缩:param origina ...
PHP百度AI的OCR图片文字识别
第一步可定要获取百度的三个东西要到百度AI网站(http://ai.baidu.com/)去注册然后获得 -const APP_ID = '请填写你的appid'; -const API_KEY ...
python 与百度人脸识别api
用python来做人脸识别代码量少思路清晰, 在使用之前我们需要在我们的配置的编译器中通过pip install baidu-aip 即可 from aip import AipFac ...
C# 扫描识别图片中的文字（.NET Framework）
环境配置本文以C#及VB.NET代码为例,介绍如何扫描并读取图片中的文字. 本次程序环境如下: Visual Studio版本要求不低于2017 图片扫描工具:Spire.OCR for .NET ...
使用Python基于百度等OCR API的文字识别
百度OCR Baidu OCR API:一定额度免费,目前是每日500次 Python SDK文档:https://cloud.baidu.com/doc/OCR/OCR-Python-SDK.htm ...

随机推荐

Python第八课学习
Python第八课学习 www.cnblogs.com/resn/p/5800922.html 1 Ubuntu学习根 / /: 所有目录都在 /boot : boot配置文件,内核和其他 linu ...
mybatis 源码分析二
1.SqlSession下的四大对象 Executor.StatementHandler.ParameterHandler.ResultSetHandler StatementHandler的作用是使 ...
java clone()
Java中对象的创建 clone顾名思义就是复制, 在Java语言中, clone方法被对象调用,所以会复制对象.所谓的复制对象,首先要分配一个和源对象同样大小的空间,在这个空间中创建一个新的对象 ...
urllib.error.URLError: <urlopen error [WinError 10061] 由于目标计算机积极拒绝，无法连接。>
因为昨天我用fiddler抓包实验它的基本功能,今天运行程序时没有打开fiddler,所以配置的代理失效了,返回这样的错误. 这个问题是因为代理设置失效,换一个代理或者取消设置代理即可.
Python学习之路并发编程--信号量、事件、队列及生产消费模型
1. 信号量对于多进程来说,多个进程同时修改数据,就可能出现安全隐患,所以引入了锁,这一机制,但锁只能有一把来控制一个的开关,当你需要几把锁的时候,就可能用到信号量的概念.他是用了锁的原理,内置了一 ...
Spring Boot 框架的依赖管理
Spring Boot为完成不同需求的Spring应用构建,提供了多种不同的依赖管理模板,每种模板均为一系列已完成的依赖的管理.例如在我们的入门程序中,需要构建web项目,我们只需添加spring-b ...
linux文本编辑器vim大全
linux基础之vim编辑器 1.vim编辑器基本介绍 vim编辑器的前身叫做vi.vi的英文名:Visual Interface.中文解释文本编辑器,你不应该用他去打开二进制可执行文件文本编辑 ...
maven各个属性参数详解
<project xmlns="http://maven.apache.org/POM/4.0.0 " xmlns:xsi="http://www.w3.org/2 ...
前端导出csv
前端导出csv export: function(data, name) { // csv文件的BOM头 \ufeff可以让excel等识别出csv文件的编码 var uri = 'data:text ...
js+ajax编码三级联动
<!DOCTYPE html><html> <head> <meta charset="UTF-8"> <title> ...

Python通过百度Ai识别图片中的文字

Python通过百度Ai识别图片中的文字的更多相关文章

随机推荐

热门专题