python识别图片文字

因为学校要求要刷一门叫《包装世界》的网课，而课程里有200多道选择题，而且只能在手机完成，网页版无法做题，而看视频是不可能看视频的，这辈子都不可能看...所以写了几行代码来进行百度搜答案。

思路如下：

手机屏幕投影到电脑上；
截图并识别图片文字；
调用百度来进行搜索；
提取html关键字。

环境配置：python3.6、第三方库：pyautogui、PIL、pytesseract、识别引擎tesseract-ocr

要识别中文，ocr引擎要下载一个中文包chi_sim放进Tesseract-OCR\tessdata里面。安装完ocr后还要配置一下调用路径，在Python36\Lib\site-packages\pytesseract找到pytesseract.py（这是我的windows路径），打开在里面添加一下路径：

1 # CHANGE THIS IF TESSERACT IS NOT IN YOUR PATH, OR IS NAMED DIFFERENTLY

2 tesseract_cmd = 'tesseract'

3 tesseract_cmd = 'C:/Program Files (x86)/Tesseract-OCR/tesseract.exe'

4 img_mode = 'RGB'

然后用AirDroid或者Vysor、360手机助手之类的将手机的屏幕投影到电脑上，用鼠标确定截图坐标，代码如下：

1 import pyautogui as pag

2 x,y = pag.position()

3 posStr = "position:"+str(x).rjust(4)+','+str(y).rjust(4)

4 print(posStr)

要获取两个坐标（截图开始坐标和结束坐标），然后利用获取的坐标运用如下代码截图并调用ocr引擎识别（识别出来的字是每个用空格分开的，所以要去除字符串中的空格），代码如下：

 from PIL import Image

 from PIL import ImageGrab

 import pytesseract

 import webbrowser

 pos = (0,245,425, 327)

 cut_img = ImageGrab.grab(pos)

 cut_img.save('C:/imgSave/1.jpg') #保存截图到文件夹中

 print("screenshots sucess")

 text=pytesseract.image_to_string(Image.open('C:/imgSave/1.jpg'),lang='chi_sim') #调用识别引擎识别

 text=text.replace(" ","") #去空格

 print(text)

 url = 'http://www.baidu.com/s?wd=%s' % text #调用百度搜索

 webbrowser.open(url)

最终因为搜出来的全是题库，所以就没有提取html关键字了，其实是懒。

python识别图片文字的更多相关文章

python 识别图片文字
今天群里有兄弟问如何把图片的文字给识别出来对于python来说这不是小菜一碟吗,于是乎让pupilheart狠狠的吹了一波(哈哈,竟然没懂),下面将整个实现过程给大家实现下: 方法一:自己搞定ORC ...
python3 识别图片文字
1.下载相关组件安装:pip install Pillow 或下载:https://pypi.org/project/Pillow/5.2.0/ ,https://pypi.org/project ...
python 识别图片验证码报IOError
说一下困扰了我一周的问题:识别图片验证码本来我按照安装步骤(http://www.cnblogs.com/yeayee/p/4955506.html?utm_source=tuicool&u ...
浅析点对点(End-to-End)的场景文字识别(图片文字)
一.背景随着智能手机的广泛普及和移动互联网的迅速发展,通过手机等移动终端的摄像头获取.检索和分享资讯已经逐步成为一种生活方式.基于摄像头的 (Camera-based)的应用更加强调对拍摄场景的理解 ...
python 识别图片上的数字
https://blog.csdn.net/qq_31446377/article/details/81708006 ython 3.6 版本 Pytesseract 图像验证码识别环境: (1) ...
C#调用OCR组件识别图片文字
图片识别的技术到几天已经很成熟了,只是相关的资料很少,为了方便在此汇总一下(C#实现),方便需要的朋友查阅,也给自己做个记号. 图片识别的用途:很多人用它去破解网站的验证码,用于达到自动刷票或者是批量 ...
python爬虫20 | 小帅b教你如何使用python识别图片验证码
当你在爬取某些网站的时候对于你的一些频繁请求对方会阻碍你常见的方式就是使用验证码验证码的主要功能就是区分你是人还是鬼(机器人) 人想法设法的搞一些手段来对付技术而技术又能对付人们的想法 ...
python实现图片文字提取，准确率高达99%，强无敌！！！
上次我使用的百度AI开放平台的API接口实现图片的转化,后来有许多小伙伴都私信问我,怎么获取百度AI平台的AK和SK.为了统一回答大家的问题,今天我又使用百度API实现了一个从图片中提取文字和识别身份 ...
python识别图片生成字符模式
此python文件来自D7哥, 放在这里备份. 用法 python3 PIL\&argparse.py 1.jpg -o test.txt --width 300 --height 300 p ...

随机推荐

3. MariaDB设置主从复制
翻译人员: 铁锚翻译日期: 2013年12月25日原文链接: Setting Up Replication 主从复制包含两个步骤: 在 master 主服务器(组)上的设置,以及在 slave ...
linux C 获取当前的工作目录
#include <stdio.h> #include <string.h> #include <unistd.h> int main(void) { char b ...
Android开源项目——带图标文字的底部导航栏IconTabPageIndicator
接下来的博客计划是,在<Android官方技术文档翻译>之间会发一些Android开源项目的介绍,直接剩下的几篇Android技术文档发完,然后就是Android开源项目和Gradle翻译 ...
MT6575 3G切换2G
因为了节省成本,需要从现在的3G方案切换置2G方案,做的修改,做个笔记. 一: 将MTK给过来的补丁编译出如下文件. 二:在mediatek/custom/common/modem/ 路径下增加一个 ...
Retinex图像增强算法
前一段时间研究了一下图像增强算法,发现Retinex理论在彩色图像增强.图像去雾.彩色图像恢复方面拥有很好的效果,下面介绍一下我对该算法的理解. Retinex理论 Retinex理论始于Land和M ...
关于iOS socket的讲解介绍
socket(套接字)是通信的基石,是支持TCP/IP协议的网络通信的基本操作单元,包含进行网络通信必须的五种信息:连接使用的协议,本地主机的IP地址,本地进程的协议端口,远地主机的IP地址,远地进程 ...
Web应用程序设计十个建议
原文链接: Top 10 Design Tips for Web Apps 原文日期: 2014年04月02日翻译日期: 2014年04月11日翻译人员: 铁锚现代web应用通常在互联网上通过 ...
web报表工具FineReport的公式编辑框的语法简介
FINEREPORT用到公式的地方非常多,单元格(以=开头的便被解析为公式),条件显示,数据字典,报表填报属性值定义,图表标题,轴定义,页眉页脚,甚至单元格的其他属性中的鼠标悬浮提示内容都可以写公式, ...
obj-c中-fobjc-arc-exceptions的解释
在开启ARC之后正常情况下一切和内存有关的申请和释放操作皆不用你关心了,ARC全全帮你包办了.但是还有极少数的情况下,编译器无法为你生成合适的ARC额外代码,比如obj-c异常就是这么一个例子. 话句 ...
Android的启动过程分析(从进程和Framework的角度)-android学习之旅（98）
Android的启动过程包含从Linux加载到home程序运行的过程,如下图所示: 1.linux内核: Android是基于Linux内核的系统平台.启动时,首先通过bootloader加载LInu ...

python识别图片文字

环境配置：python3.6、第三方库：pyautogui、PIL、pytesseract、识别引擎tesseract-ocr

python识别图片文字的更多相关文章

随机推荐

热门专题