python 图片转文字小工具
应群友要求,要做一个图片转文字的格式,因为有些人的简历中只有一张图片要提取他里面的文字就不好办了。
于是就有了下面这个小工具:
功能:选择要识别的图片后,识别出来后存到.txt文本中。
实现原理,基于百度“文字识别”通用版的api接口调用。
有一点需要说明的是可能无法识别百分百准确的,格式排版还是要人为去处理一下。

代码如下:
from aip import AipOcr
from PIL import Image as PImage
from PIL import ImageTk
from tkinter import *
from tkinter import filedialog
将图片内容翻译为文字,显示在文本框内
def trans():
# """ 你的 APPID AK SK """
APP_ID = ''
API_KEY = ''
SECRET_KEY = '*************'
client = AipOcr(APP_ID, API_KEY, SECRET_KEY)
contents.delete('1.0', END)
transTxt = client.basicGeneral(open(filePath.get(), 'rb').read())
# 对transTxt进行处理 去空格,换行符去重
transTxt=transTxt['words_result']
# transTxt=[{'words': '每个人总在仰望和'}, {'words': '羡慕着别人的幸福'}, {'words': '一回头'}, {'words': '却发现自己正被别'}, {'words': '人仰望和羡慕着'}]
words_content=''
for words in transTxt:
values =words['words']
words_content +=values+'\n'
print(words_content)
contents.insert(INSERT,words_content)
# 将文字保存到TXT文件
with open(filePath.get()+'_to_word.txt', 'w') as f:
f.write(words_content)
打开图片文件,显示路径,并将图片展现
def openfile():
filename.delete('1.0', END)
filePath.set(filedialog.askopenfilename())
filename.insert(1.0, filePath.get())
org_img = PImage.open(filePath.get())
# 调整图片显示大小 600*800
w, h = org_img.size
if w > 600:
h = int(h * 600 / w)
w = 600
if h > 800:
w = int(w * 800 / h)
h = 800
img = ImageTk.PhotoImage(org_img.resize((w, h)))
showPic.config(image=img)
showPic.image = img # 保持一个引用才能显示图片,tkinter的BUG
设置主窗口
top = Tk()
top.title("图片转文字 引擎:百度云API文字识别 Made by: Running")
top.iconbitmap("./pic/y1.ico")
top.geometry("800x600")
filePath = StringVar()
第一个窗体
frame1 = Frame(top, relief=RAISED, borderwidth=2)
frame1.pack(side=TOP, fill=BOTH, ipady=5, expand=0)
Label(frame1, height=1, text="图片路径:").pack(side=LEFT)
filename = Text(frame1, height=2)
filename.pack(side=LEFT, padx=1, pady=0, expand=True, fill=X)
Button(frame1, text="打开文件", image='', command=openfile).pack(side=LEFT, padx=5, pady=0)
Button(frame1, text="识别图片", image='', command=trans).pack(side=LEFT, padx=5, pady=0)
第二个窗体
frame2 = Frame(top, relief=RAISED, borderwidth=2)
frame2.pack(side=LEFT, fill=BOTH, expand=1)
Label(frame2, text='待识别的图片:', borderwidth=5).pack(side=TOP, padx=20, pady=5)
showPic = Label(frame2, text='图片显示区')
showPic.pack(side=BOTTOM, expand=1, fill=BOTH)
第三个窗体
frame3 = Frame(top)
frame3.pack(side=RIGHT, fill=BOTH, expand=1)
contents = ScrolledText(frame3)
Label(frame3, text='图片识别结果:', borderwidth=5).pack(side=TOP, padx=20, pady=10)
contents = Text(frame3, font=('Arial', 15))
contents.pack(side=TOP, expand=1, fill=BOTH)
Label(frame3, text='Copyright 2024 baidu.com ALL Rights Reserved', borderwidth=5).pack(side=BOTTOM, padx=20, pady=10)
top.mainloop()
python 图片转文字小工具的更多相关文章
- InkImageDataSetGenerator-开源一个可用于机器学习的书写轨迹图片生成的小工具
这是一个简单易用的图片数据集生成小工具,基于OpenCV和UWP Ink API,它可以根据指定的手写轨迹生成一系列各个角度的图片.每张图片的尺寸和总体数量都是可以指定的,均存放在统一的生成目录中.h ...
- python开发目录合并小工具 PathMerge
前言 这个程序陆陆续续开发了几天,正好我在学Python,就一边做一边学,倒是学到不少东西. 不得不说python是快速开发的好工具. 程序做了一些改进,这两天又忙着毕设,现在才想起来发到博客上.想想 ...
- python 3.6 MJ小工具
2017.07.14 update 做了个界面,不需要使用cmd命令行+文件路径的方式来使用了: 链接如下: http://www.cnblogs.com/chenyuebai/p/7150382.h ...
- 语音转文字小工具开发Python
# -*- coding: utf- -*- import requests import re import os import time from aip import AipSpeech fro ...
- 目不识丁的我使用Python编写汉字注音小工具
一万点暴击伤害 人懒起来太可怕了,放了个十一充分激发了我的惰性.然后公众号就这么停了半个月,好惭愧- 新学期儿子的幼儿园上线了APP,每天作业通过app布置后,家长需要陪着孩子学习,并上传视频才算完成 ...
- python转exe的小工具
其实只是在cxfreeze的基础上加了个壳,做成窗口软件了 使用了pyqt做的界面,软件发布在了开源中国上,可以直接去下面的地址查看 http://git.oschina.net/robocky/py ...
- python之字符聊天小工具
server side: # coding: gb2312#socket server端#获取socket构造及常量from socket import *#''代表服务器为localhostmyHo ...
- Python: tkinter实例改名小工具
#!/usr/bin/env python #coding=utf-8 # # 版权所有 2014 yao_yu (http://blog.csdn.net/yao_yu_126) # 本代码以MIT ...
- 入坑python 自己写的小工具,纪念一下
这个程序的功能是可以从表格中读取某一列数据,传到IDs 这一个参数里,然后在url中获取相应的请求值,并打印 import urllib.request import json import xlrd ...
- python一些实用的小工具
1 搭一个简易的本地局域网 python -m http.server 2 获取当前目录下的所有文件名 3 进度条效果 import sys,time for i in range(50): sy ...
随机推荐
- NC19777 卡牌游戏
题目链接 题目 题目描述 小贝喜欢玩卡牌游戏.某个游戏体系中共有N种卡牌,其中M种是稀有的.小贝每次和电脑对决获胜之后都会有一个抽卡机会,这时系统会随机从N种卡中选择一张给小贝.普通卡可能多次出现,而 ...
- Centos中报错apt Command not Found
先说结论: 在centos下用yum install xxxyum和apt-get的区别: 一般来说著名的linux系统基本上分两大类: RedHat系列:Redhat.Centos.Fedora等 ...
- Centos8 单机配置 Zookeeper3.6.3 集群
安装 Zookeeper 3.6.3 前提 已经安装好 JDK8+. 如果使用JDK8, 版本需要在211以上. 下载, 解压 使用root用户 wget https://downloads.apac ...
- Java I/O 教程(十 一) BufferedWriter和BufferedReader
Java BufferedWriter 类 Java BufferedWriter class 继承了Writer类,为Writer实例提供缓冲. 提升了写字符和字符串性能. 类定义: public ...
- Java并发编程实例--20.使用Semaphores(信号量)控制资源的并发读取
前面我们介绍了2种同步机制: 1)使用synchronized关键字 2)使用Lock接口及其实现类: ReentrantLock,ReentrantReadWriteLock.ReadLock, a ...
- Java并发编程实例--16.使用ReentrantLock实现线程同步
Java提供另一机制去同步代码块.它比synchronized关键字更强大且易用. 它是基于Lock接口和其实现类例如:ReentrantLock. 这一机制对比synchronized关键字的优势在 ...
- 文心一言 VS 讯飞星火 VS chatgpt (199)-- 算法导论15.2 1题
一.用go语言,对矩阵规模序列(5,10,3,12,5,50,6),求矩阵链最优括号化方案. 文心一言,代码正常运行: 在Go语言中,为了找到矩阵链乘法的最优括号化方案,我们通常会使用动态规划(Dyn ...
- centos上使用makefile编译sliver时 提示gcc 错误,cannot find -ldl cannot find -lpthread cannot find -lc
github.com/bishopfox/sliver/server /usr/local/go/pkg/tool/linux_amd64/link: running gcc failed: exit ...
- typing模块中Protocol协议的使用
说明 在 Python 的 typing 模块中,Protocol 是一个用于定义协议(Protocol)的类. 协议是一种形式化的接口,定义了一组方法或属性的规范,而不关心具体的实现.Protoco ...
- 修改centos7虚拟机的用户密码
在忘记原密码无法登录桌面的情况下,修改centos7的用户密码 非常规启动,进入编辑启动菜单 在启动GRUB菜单中选择编辑选项,按键e进入编辑; 找到linux16开头的一行,在该行中寻找ro的所在地 ...