如何用python运用ocr技术来识别文字

要先安装ocr技术，也就是光学符号识别，通过扫描等光学输入方式将各种票据、报刊、书籍、文稿及其他印刷品的文字转化为图像信息，再利用文字识别技术将图像信息转化为可以使用的文本的技术（我在百度百科抄的），市面上大多数的文本识别，都基本是ocr技术。那用python怎么搞呢？

1、安装环境

我们要先安装Tesseract，大家可以参考https://cuiqingcai.com/31102.html（不要安装tesserocr，有坑），大家可以按照这上面的步骤一步步安装，就是像我一样使用ubuntu的人，用git命令下载tessdata时要先下载git，然后github下载极慢，经常动不动下一半报错失败，你先输入sudo vi /etc/hosts，抄https://www.cnblogs.com/blog-dyn/p/16071670.html里面的ip进去，之后按下esc，输入:wq(这里面的vi可以是vim，建议大家学习一下vim,效率很高)，在之后刷新DNS，输入sudo systemctl restart systemd-resolved，下载应该会快一点（总之我的电脑有用），然后pip安装：

pip3 install pytesseract

还要安装Pillow库，来做图像处理：

pip3 install Pillow

如果安装过慢，可以换源，可参考https://www.cnblogs.com/HeavyShield/p/12294179.html

2、正片

如下面的程序

 1 #导入

 2 import pytesseract#ocr库

 3 from PIL import Image#PIL库

 4

 5 #导入图片

 6 add_image = input("图片地址......")

 7 try:#异常处理

 8     image = Image.open(add_image)

 9 except FileNotFoundError:

10     print("no such file or dictionary!")

11 else:

12     result = pytesseract.image_to_string(image, lang="chi_sim+eng")#ocr识别

13     with open("test.txt","w") as fp:

14         fp.write(result)#存入txt

导入库应该没什么问题， image = Image.open(add_image) 来新建一个目标图片的Image对象，然后神之一笔来啦， result = pytesseract.image_to_string(image, lang="chi_sim+eng") 中image_to_string将图片中的文字转为文本，括号中第一项为目标图片的Image对象，lang设置识别的语言，这里"chi_sim+eng"为简体中文和英语。最后的结果存入result，没啦！区区几行代码，我们便识别出图像中的文字并存储到文件中

3、可以干什么

对于爬虫来说，登录的验证码需要填写才能进入网站，有一些网站还使用像

的验证码，你可以通过requests来爬取图片，然后人工填写验证码上传，如果使用ocr技术，可以大大提高爬取的效率，不必每一个验证码亲历亲为。此外还可以得到像

这样的代码，不必一个字一个字地去敲（大家可以以这两个思路来做一下作业）

如何用python运用ocr技术来识别文字的更多相关文章

ABBYY OCR技术教电脑阅读缅甸语（下）
文本行检测到之后,我们开始寻找单词和字母之间的间隙,这一次,我们运用了水平直方图,将大的间隙假设为单词之间的空隙,小的间隙理解为字母之间的空隙,检测缅甸文本中的空隙几乎没有出现问题,不像泰语,几乎没有 ...
Python爬虫入门教程 56-100 python爬虫高级技术之验证码篇2-开放平台OCR技术
今日的验证码之旅今天你要学习的验证码采用通过第三方AI平台开放的OCR接口实现,OCR文字识别技术目前已经比较成熟了,而且第三方比较多,今天采用的是百度的. 注册百度AI平台官方网址:http:/ ...
使用Python进行OCR -- 识别图片中的文字
工具 Tesseract pytesseract tesserocr 朋友需要一个工具,将图片中的文字提取出来.我帮他在网上找了一些OCR的应用,都不好用.所以准备自己研究,写一个Web APP供他使 ...
【OCR技术系列之八】端到端不定长文本识别CRNN代码实现
CRNN是OCR领域非常经典且被广泛使用的识别算法,其理论基础可以参考我上一篇文章,本文将着重讲解CRNN代码实现过程以及识别效果. 数据处理利用图像处理技术我们手工大批量生成文字图像,一共360万 ...
你知道现在有一种新的OCR技术叫“移动端车牌识别”吗？
核心内容:车牌识别.OCR识别技术.移动端车牌识别.手机端车牌识别.安卓车牌识别.Android车牌识别.iOS车牌识别一.移动端车牌识别OCR技术研发原理移动端车牌识别是基于OCR识别的一种应用 ...
【OCR技术系列之四】基于深度学习的文字识别（3755个汉字）
上一篇提到文字数据集的合成,现在我们手头上已经得到了3755个汉字(一级字库)的印刷体图像数据集,我们可以利用它们进行接下来的3755个汉字的识别系统的搭建.用深度学习做文字识别,用的网络当然是CNN ...
关于python 使用腾讯云OCR 通用印刷体识别
腾讯的python SDK没有通用印刷体识别,所以参考了别人识别网上图片的方式:https://www.cnblogs.com/semishigure/p/7690789.html 但是咱们使用的基本 ...
【OCR技术系列之七】端到端不定长文字识别CRNN算法详解
在以前的OCR任务中,识别过程分为两步:单字切割和分类任务.我们一般都会讲一连串文字的文本文件先利用投影法切割出单个字体,在送入CNN里进行文字分类.但是此法已经有点过时了,现在更流行的是基于深度学习 ...
【OCR技术系列之四】基于深度学习的文字识别
上一篇提到文字数据集的合成,现在我们手头上已经得到了3755个汉字(一级字库)的印刷体图像数据集,我们可以利用它们进行接下来的3755个汉字的识别系统的搭建.用深度学习做文字识别,用的网络当然是CNN ...
【OCR技术系列之一】字符识别技术总览
最近入坑研究OCR,看了比较多关于OCR的资料,对OCR的前世今生也有了一个比较清晰的了解.所以想写一篇关于OCR技术的综述,对OCR相关的知识点都好好总结一遍,以加深个人理解. 什么是OCR? OC ...

随机推荐

KingbaseES V8R6 常用的系统函数
查看当前日志文件lsn位置: select sys_current_wal_lsn(); 查看某个lsn对应的日志名: select sys_walfile_name('0/1162FBA0'); 查 ...
Chrome浏览器使用小技巧
前言 Notes made by IT-Pupil-Poo-Poo-Cai(IT小学生蔡坨坨). The notes are for reference only. Personal blog:www ...
关于 kafka 消息的顺序问题一二
顺序就像就是 12345,任何 12354.12543.51234等都不行. 因为是 mq,所以必然涉及三个主体:发送方.消息服务器.消费方. 一.kafka 消息服务器 kafka brokers ...
#折半搜索，状压dp#nssl 1471 Y
分析设\(dp[i][j][s]\)表示从\(i\)到\(j\)的一条路径状态为\(s\)是否存在但是这样肯定会T掉,考虑拼凑路径,分成两部分, 设\(dp[0/1][s]\)分别表示以某个起点/ ...
#数学期望，状压dp，记忆化搜索#nssl 1468 V
分析赛时写了个\(O(n!)\)的纯暴力,其实我现在才发现\(O(n!)\)的暴力一般都能用\(O(n2^n)\)的状压dp解决但是其实不是每个状态都能被访问到,所以若\(n\)过大,用\(map ...
准备Python环境学习OpenCV的使用
安装venv模块,执行如下命令: sudo apt-get install python3-venv 创建venv环境,命名为images,执行如下命令: python3 -m venv images ...
使用OHOS SDK构建tinyexr
参照OHOS IDE和SDK的安装方法配置好开发环境. 从github下载源码. 执行如下命令: git clone https://github.com/syoyo/tinyexr.git 进入源码 ...
动态库 DLL 封装二：dll封装方法
例:我新建的工程是,带lib的MFC规则的DLL 主要有三个文件需要写东西 ( .h / .cpp / .def ) 示例: // a.h ...... #ifdef __cplusplus e ...
插入排序的基本实现【数据结构与算法—TypeScript 实现】
笔记整理自 coderwhy 『TypeScript 高阶数据结构与算法』课程概念本质:将数列分为已排序和未排序,将未排序中的元素插入到已排序中的合适位置特性复杂度分析时间复杂度: 最好情况 ...
【中秋国庆不断更】HarmonyOS对通知类消息的管理与发布通知（下）
[中秋国庆不断更]HarmonyOS对通知类消息的管理与发布通知(下) 一.发布进度条类型通知进度条通知也是常见的通知类型,主要应用于文件下载.事务处理进度显示.HarmonyOS提供了进度条模板, ...

如何用python运用ocr技术来识别文字

如何用python运用ocr技术来识别文字的更多相关文章

随机推荐

热门专题